فایل Robot.txt چیست؟
فایل Robot.txt همان چیزی است که به موتورهای جستجو میگوید که به کدام صفحات دسترسی داشته باشند و آنها را ایندکس کنند و به چه صفحاتی دسترسی پیدا نکنند.
مثلا اگر شما در فایل Robot.txtتان مشخص کنید که نمیخواهید موتورهای جستجو به صفحه قدردانی یا همان Thank you page دسترسی داشته باشند، آن صفحه در نتایج جستجو نمایش داده نخواهد شد و کاربران وب قادر نخواهند بود آن را پیدا کنند. جلوگیری از دسترسی موتورهای جستجو به صفحات خاص در سایتتان، هم برای حفظ حریم خصوصی سایت و هم سئوی آن ضروری است.
اما نکتهای که باید مدنظر قرار دهید این است که بهینه نکردن این فایل باعث به وجود آمدن مشکلات سئو میشود که بر رتبه و ترافیک سایتتان هم تاثیر میگذارد.
چطور باید فایل Robot.txt را بهینه کرد؟
شما میتوانید با محدود کردن دسترسی و خزیدن موتورهای جستجو به صفحات سایتتان این ربات را بهینه کنید؛ مثلا دستهبندیها و صفحات زیادی در سایتتان هست که لزومی ندارد موتورهای جستجو به آنها سر بزنند. آنها فقط بودجه خزیدن سایت شما را مصرف میکنند. پس اگر صفحه Robot.txt مناسب را ایجاد کنید، میتوانید به رباتهای موتور جستجو (و به خصوص Googlebot) بگویید از رفتن به یک سری صفحات خاص بپرهیزند.
یکی از بهترین روشها برای افزایش بودجه خزیدن این است که بخشهایی که برای عموم قابل نمایش نیستند را در Robot.txt قرار داده تا خزیدنی به آنها صورت نگیرد؛ مثلا میتوانید صفحه login که مخصوص ادمین سایت است را در فایل ربات قرار دهید.
یا برخی از محتواهای تکراری به رباتهای موتور جستجو میگویند که به یکی از این صفحات تکراری نخزند؛ مثلا بین نسخه سازگار با چاپگر یک صفحه و ورژن معمولی آن، میتوانید اولی را در فایل قرار دهید.
صفحات قدردانی هم از آن دسته مواردی هستند که ممکن است توسط گوگل در دسترس قرار گیرند، بنابراین میتوانید با گنجاندن آن در Robot.txt به بهینه شدن این فایل کمک کنید.