Loading
Hãy tìm kiếm trước khi đặt câu hỏi đến các chuyên gia tại Diễn đàn SEO - Quảng Bá Web

Chú ý: thành viên mới tham gia (chưa đủ 30 bài) sẽ không đăng được bài mới (thảo luận được chấp nhận toàn bộ) trong những Box không thuộc về SEO - Digital Marketing (vd: Giao lưu, Quảng cáo v.v.. do không có đóng góp cho anh em SEOer mà toàn Spam bài quảng cáo v.v..)
  • Diễn đàn Quảng bá web - Thông báo khẩn

    1.  

    + Trả Lời Ðề Tài
    Trang 2/2 đầuđầu 1 2
    kết quả từ 11 tới 15 trên 15
    1. #1
      Tham gia ngày
      Oct 2011
      Bài gởi
      236
      Thanks
      15
      Thanked 257 Times in 92 Posts

      Robots.txt cho website sử dụng nhiều domain

      Như các bạn đã biết, các Doanh nghiệp thường hay mua nhiều tên miền cho website của họ. Ở đây tôi không thảo luận về lý do tại sao họ lại làm như vậy, nhưng thực tế rõ ràng là có rất nhiều tên miền trỏ về cùng 1 hosting (1 website có nhiều tên miền khác nhau). Thế thì xét theo nguyên tắc của SEO, chúng ta sẽ có nhiều website và những website này trùng lặp nội dung.


      Tôi được 1 số bạn đặt vấn đề cụ thể như sau:
      • Họ có 3 domain: abc.com | def.com | xyz.com
      • 3 domain này cùng 1 hosting
      • Họ chọn abc.com là tên miền chính, họ không muốn spider index các URL xuất phát từ 2 tên miền còn lại
      Oh, quá dễ, dùng robots.txt chặn (disallow) là xong. Nhưng khổ nỗi, robots.txt không phân biệt được tên miền, nên chúng ta không thể
      • Disallow: /def.com
      • Disallow: /zyz.com
      Làm sao ? Và đây là giải pháp. Chúng ta chuẩn bị 3 file robots.txt tương ứng cho từng tên miền và kiểm tra nếu request của user xuất phát từ tên miền nào thì “gọi” file robots.txt cho tên miền đó.
      robots_abc.txt <– file robots.txt cho tên miền abc.com
      Code:
      User-agent: * Disallow: /administrator/ Disallow: /cache/ Disallow: /components/ Disallow: /images/ Disallow: /includes/ Disallow: /installation/ Disallow: /language/ Disallow: /libraries/
      robots_def.txt <– file robots.txt cho tên miền def.com
      Code:
      User-agent: * Disallow: /
      robots_xyz.txt <– file robots.txt cho tên miền xyz.com
      Code:
      User-agent: * Disallow: /
      Nhiệm vụ còn lại của chúng ta là viết lại đường dẫn file robots.txt tương ứng cho từng tên miền tại file .htaccess
      RewriteCond %{HTTP_HOST} ^abc.com$ [NC]
      RewriteRule ^robots.txt$ robots_abc.txt [L]
      RewriteCond %{HTTP_HOST} ^def.com$ [NC]
      RewriteRule ^robots.txt$ robots_def.txt [L]
      RewriteCond %{HTTP_HOST} ^xyz.com$ [NC]
      RewriteRule ^robots.txt$ robots_xyz.txt [L]
      Đến đây thì các bạn an tâm, spider chỉ có thể index như chỉ dẫn trong file robots_abc.txt, còn với những URL xuất phát từ tên miền def.com và xyz.com sẽ không bao giờ được index nên việc trùng lặp nội dung không thể xảy ra.
      Nguồn phaiSEO.com



       Xem bài liên quan cùng danh mục:



      Chữ ký của SEOchicken

      ****************Hãy cùng chia sẻ với bạn bè bằng cách****************

      Copy đường link dưới đây gửi đến bạn bè!

      Đặt từ khóa tại đây ? Xem bảng giá quảng cáo tại QBW

    2. The Following 2 Users Say Thank You to SEOchicken For This Useful Post:

      muoivove (22-01-2013)

    3. #11
      Tham gia ngày
      Apr 2013
      Bài gởi
      8
      Thanks
      0
      Thanked 0 Times in 0 Posts

      Ðề: Robots.txt cho website sử dụng nhiều domain

      thanhk you very muck. thanhk you very muck. thanhk you very muck. thanhk you very muck.

    4. #12
      Tham gia ngày
      Nov 2012
      Bài gởi
      662
      Thanks
      70
      Thanked 21 Times in 20 Posts

      Ðề: Robots.txt cho website sử dụng nhiều domain

      Mỗi tên miền một web site là hợp lý nhất, có thể dùng redirect hướng về web chính cũng rất tốt


      Chữ ký của mm22mm

    5. #13
      Tham gia ngày
      Mar 2013
      Bài gởi
      91
      Thanks
      15
      Thanked 3 Times in 3 Posts

      Ðề: Robots.txt cho website sử dụng nhiều domain

      Có phải là tập robots.txt đặt duy nhất ở root hay đặt trong các thư mục cũng được ? . trường hợp của mình giờ thì thế nào hả mọi người

      mình có 1 thư mục để trong root ngang hàng index.php , thư mục này chạy sub domain , giờ mình ko muốn google index subdomain đó, cũng như ko muốn google index thư mục đó , mình chỉ cần đặt 1 tập robots.txt trong thư mục đó là xong phải ko ?

    6. #14
      Tham gia ngày
      May 2013
      Bài gởi
      9
      Thanks
      1
      Thanked 0 Times in 0 Posts

      Ðề: Robots.txt cho website sử dụng nhiều domain

      robots.txt giờ thì mình đã hiểu

    7. #15
      Tham gia ngày
      Jul 2013
      Bài gởi
      19
      Thanks
      0
      Thanked 3 Times in 2 Posts

      Ðề: Robots.txt cho website sử dụng nhiều domain

      Tên miền chính là tên miền mà khi chúng ta đánh bất kì tên miền nào trong 3 tên miền đó. Thì nó đều chỏ vào tên miền chính đúng không anh


      Chữ ký của bachvab



    + Trả Lời Ðề Tài
    Trang 2/2 đầuđầu 1 2

    Chủ đề giống nhau

    1. Robots.txt cho website sử dụng nhiều domain
      By SEOchicken in forum Thủ thuật khác
      Trả lời: 9
      Bài mới gởi: 30-11-2015, 04:04 PM
    2. Đặt link trên 1 Domain bao nhiêu là hợp lý
      By tuananh1810 in forum Liên kết (Link)
      Trả lời: 10
      Bài mới gởi: 25-07-2014, 05:29 PM
    3. Mình có rất nhiều domain .edu.vn muốn trao đổi liên kết với cả nhà
      By it1290 in forum Chợ liên kết (Trao đổi liên kết)
      Trả lời: 10
      Bài mới gởi: 17-04-2013, 09:47 PM
    4. Domain bao nhiêu tuổi thì tốt trong SEO
      By kysuseo in forum Thảo luận khác
      Trả lời: 12
      Bài mới gởi: 23-02-2013, 11:15 AM
    5. Trả lời: 6
      Bài mới gởi: 09-02-2013, 07:30 PM

    Quuyền Hạn Của Bạn

    • You may not post new threads
    • You may not post replies
    • You may not post attachments
    • You may not edit your posts

    Có thể bạn cần: 
    Hội công nghệDMCA.comQuangBaWeb.edu.vn là diễn đàn mở miễn phí dành cho các thành viên.
    Chúng tôi không chịu trách nhiệm trên thông tin người dùng đăng tải trên diễn đàn. Các trường hợp vi phạm, chúng tôi sẽ tiến hành xử lý xóa bỏ ngay lập tức. Nếu bạn nhận thấy bài viết vi phạm, xin vui lòng gởi thông báo cho chúng tôi, xin cám ơn.

    DÀNH CHO QUẢNG CÁO