Начало > WordPress, Моят блог > Как да направим оптимален robots.txt файл за блога си?

Как да направим оптимален robots.txt файл за блога си?

Файлът robots.txt е обикновен текстов файл, който указва на ботовете на търсачките кои страници могат да обхождат и да индексират. Ето някои препоръки за създаване на този файл:

  • забраняване на индексирането на RSS фийдовете от коментарите, тъй като търсачките могат да сметнат това за дублирано съдържание
  • забраняване за индексиране на trackback адресите тъй като те се индексират като празна страница
  • забраняване индексирането на файловете на WordPress

Примерен файл robots.txt за WordPress

User-agent: *
Disallow: /wp-content/
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-
Disallow: /feed/
Disallow: /trackback/
Disallow: /cgi-bin/

В този пример Disallow: /wp- забранява индексирането на всички файлове на WordPress.

В кодекса на WordPress има и други примери за файлове robots.txt.

User-agent: *
# disallow files in /cgi-bin
Disallow: /cgi-bin/
Disallow: /comments/
Disallow: /z/j/
Disallow: /z/c/
# disallow all files ending in .php
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*.txt$
#disallow all files in /wp- directorys
Disallow: /wp-*/
# disallow all files with ? in url
Disallow: /*?
# disallow any files that are stats related
Disallow: /stats*
Disallow: /about/legal-notice/
Disallow: /about/copyright-policy/
Disallow: /about/terms-and-conditions/
Disallow: /about/feed/
Disallow: /about/trackback/
Disallow: /contact/
Disallow: /tag
Disallow: /docs*
Disallow: /manual*
Disallow: /category/uncategorized*

Тези примери са за WordPress, но те лесно биха могли да се преобразуват за всякакви други сайтове.

Сподели с всички:
Dobavi.com Dao.bg Lubimi.com Ping.bg Pipe.bg Svejo.net Web-bg.com del.icio.us Facebook Google Google Reader Yahoo! MyWeb reddit StumbleUpon Technorati

Подобни публикации

  1. 13 април, 2008 в 07:05 | #1

    ми..

    Disallow: /wp-content/ не можеш да забраниш в повечето случаи..

    и си не си прав и за повечето от нещата, но robots.txt ‘Управлява’

    Стига дя знаеш за какво го ползваш и да не си ти, които ще го пише..

  2. 13 април, 2008 в 09:13 | #2

    Защо да не можеш да го забраниш за индексиране?
    Обоснови се все пак. Няма нужда тази папка да бъде индексирана. Тази забрана за индексиране действа единствено на търсещите машини. Освен това всички тези примери са взети от кодекса на WordPress. Те са приложени в този блог.

  1. 13 април, 2008 в 08:02 | #1
  2. 19 юни, 2008 в 10:41 | #2
SEO Blogs - Blog Catalog Blog Directory seo google