Penggunaan Sitemap dan Robots.txt yang betul untuk mengawal crawling adalah dengan memastikan kedua-dua fail ini saling melengkapi untuk mengarahkan mesin pencari mengindeks laman web anda secara optimum dan mengelakkan halaman yang tidak diingini diindeks.
Berikut adalah panduan utama:
-
Letakkan URL sitemap dalam fail robots.txt supaya crawler mesin pencari dapat dengan cepat menemui semua URL penting laman web anda. Contohnya:
Sitemap: https://www.domainanda.com/sitemap.xml
Jika ada lebih dari satu sitemap, letakkan setiap URL sitemap pada baris berasingan.
-
Fail robots.txt berfungsi untuk mengawal akses crawler ke bahagian tertentu laman web dengan arahan
Disallow
. Contohnya:User-agent: * Disallow: /folder-rahsia/
Ini memberitahu semua crawler untuk tidak mengakses folder tersebut. Namun, perlu diingat bahawa robots.txt hanya memberi arahan dan crawler yang tidak patuh boleh mengabaikannya. Juga, URL yang disekat masih boleh muncul dalam hasil carian jika terdapat pautan dari laman lain.
-
Pastikan sintaks robots.txt betul dan mudah difahami oleh pelbagai jenis crawler kerana setiap crawler mungkin mentafsir arahan secara berbeza. Gunakan arahan yang standard dan elakkan kesilapan tatabahasa dalam fail tersebut.
-
Selain robots.txt, gunakan kaedah lain untuk menghalang pengindeksan halaman sensitif, seperti tag
noindex
dalam meta tag HTML atau perlindungan kata laluan pada server, kerana robots.txt tidak menjamin halaman tidak akan diindeks jika ada pautan luar ke halaman tersebut. -
Daftarkan sitemap anda secara manual di alat webmaster utama seperti Google Search Console dan Bing Webmaster Tools untuk mendapatkan statistik dan status pengindeksan yang lebih baik.
-
Sentiasa periksa dan kemaskini sitemap dan robots.txt secara berkala untuk memastikan tiada error dan semua URL yang penting dapat diakses oleh crawler.
Ringkasnya, cara betul mengawal crawling ialah dengan:
- Membuat sitemap yang lengkap dan kemaskini.
- Menambah URL sitemap dalam fail robots.txt.
- Menggunakan arahan
Disallow
dalam robots.txt untuk menghalang crawling halaman tertentu. - Menggunakan tag
noindex
atau perlindungan lain untuk mengelakkan pengindeksan halaman sensitif. - Mendaftarkan sitemap pada alat webmaster untuk pemantauan.
Langkah ini memastikan mesin pencari dapat mengindeks laman web anda dengan betul dan mengawal halaman mana yang boleh diakses atau tidak oleh crawler.
Malay Ranking menawarkan perkhidmatan trafik laman web berkualiti tinggi di Malaysia. Kami menyediakan pelbagai jenis perkhidmatan trafik untuk pelanggan kami, termasuk trafik laman web, trafik desktop, trafik mudah alih, trafik Google, trafik carian, trafik eDagang, trafik YouTube, dan trafik TikTok. Laman web kami mempunyai kadar kepuasan pelanggan 100%, jadi anda boleh membeli trafik SEO dalam jumlah besar secara dalam talian dengan yakin. Hanya dengan 720 PHP sebulan, anda boleh meningkatkan trafik laman web serta-merta, memperbaiki prestasi SEO, dan melonjakkan jualan!
Sukar memilih pakej trafik yang sesuai? Hubungi kami dan staf kami akan membantu anda.
Konsultasi percuma