Quản lý sơ đồ trang web bằng cách sử dụng báo cáo Sơ đồ trang web

78

URL không thể truy cập được

Google đã gặp lỗi khi cố thu thập dữ liệu một URL trong sơ đồ trang web của bạn. Hãy kiểm tra URL trong sơ đồ trang web bằng cách sử dụng công cụ kiểm tra URL để biết Google có thể truy cập URL này hay không.

Không thể theo URL

Google không thể thu thập dữ liệu tất cả các URL được liệt kê trong sơ đồ trang web của bạn. Dưới đây là một số lý do có thể xảy ra:

Bạn đang xem: Quản lý sơ đồ trang web bằng cách sử dụng báo cáo Sơ đồ trang web

  • URL chứa quá nhiều lệnh chuyển hướng khiến trình thu thập dữ liệu web của Google không thể theo toàn bộ lệnh đó. Chúng tôi đề nghị bạn nên thay thế mọi URL chuyển hướng trong sơ đồ trang web của bạn bằng các URL mà bạn thực sự cần Google thu thập dữ liệu.
    • Nếu bạn chuyển hướng vĩnh viễn từ trang này sang trang khác, hãy dùng chuyển hướng vĩnh viễn.
    • Tránh sử dụng chuyển hướng JavaScript hoặc meta-refresh.
  • Google đang gặp vấn đề với các URL tương đối trong sơ đồ trang web của bạn. Nếu có thể, hãy sử dụng đường liên kết tuyệt đối hoặc đầy đủ thay vì đường liên kết tương đối. Ví dụ: khi liên kết đến một trang khác trong trang web của bạn, hãy liên kết đến https://www.example.com/mypage.html thay vì mypage.html.

URL không được phép

Sơ đồ trang web của bạn bao gồm một số URL ở cấp cao hơn hoặc nằm trên miền khác so với tệp sơ đồ trang web.

Cấp cao hơn: Nếu sơ đồ trang web của bạn nằm tại http://www.example.com/mysite/sitemap.xml, thì các URL sau không hợp lệ cho sơ đồ trang web đó:

  • http://www.example.com/ – Cấp cao hơn so với sơ đồ trang web
  • http://www.example.com/yoursite/ – Trong một thư mục khác thuộc cùng sơ đồ trang web (bạn phải di chuyển lên và xuống để vào thư mục này).

Miền khác: Kiểm tra để đảm bảo tất cả URL đều bắt đầu với cùng một miền như vị trí sơ đồ trang web của bạn. Ví dụ, nếu sơ đồ trang web của bạn nằm tại http://www.example.com/sitemap.xml, thì các URL sau không hợp lệ cho sơ đồ trang web đó:

  • http://example.com/ – Thiếu “www”
  • www.example.com/ – Thiếu “http”
  • https://www.example.com/ – Sử dụng https thay vì http

Lỗi nén

Google đã gặp lỗi khi tiến hành giải nén cho tệp nén sơ đồ trang web của bạn. Hãy nén lại tệp sơ đồ trang web của bạn (bằng công cụ như gzip), tải tệp đã nén lên trang web và gửi lại.

Sơ đồ trang web rỗng

Sơ đồ trang web của bạn không chứa bất kỳ URL nào. Hãy kiểm tra sơ đồ trang web của bạn và đảm bảo rằng sơ đồ không trống.

Lỗi kích thước tệp sơ đồ trang web: Sơ đồ trang web của bạn vượt quá giới hạn kích thước tệp tối đa.

Sơ đồ trang web của bạn lớn hơn 50MB khi đã giải nén. Nếu sơ đồ trang web của bạn lớn hơn giới hạn, hãy chia sơ đồ thành nhiều sơ đồ trang web nhỏ hơn và liệt kê chúng trong tệp chỉ mục sơ đồ trang web rồi gửi (các) tệp chỉ mục đó.

Giá trị thuộc tính không hợp lệ

Bạn chỉ định một giá trị không hợp lệ cho thuộc tính thẻ XML. Kiểm tra sơ đồ trang web để đảm bảo rằng chỉ các thuộc tính được phép hiện diện, và bạn chỉ gán các giá trị được phép theo đặc tả sơ đồ trang web. Kiểm tra chính tả của thuộc tính và giá trị của bạn.

Ngày không hợp lệ

Sơ đồ trang web của bạn có chứa một hoặc nhiều giá trị ngày không hợp lệ. Lỗi này có thể là vì ngày có định dạng không đúng hoặc ngày không hợp lệ. Giá trị ngày phải sử dụng Chuẩn mã hoá ngày giờ W3C, mặc dù bạn có thể bỏ qua phần giờ. Hãy đảm bảo rằng ngày của bạn khớp với một trong các định dạng ngày giờ W3C sau:

 0796140196T18:00:15+00:00 

Việc xác định thời gian là tùy chọn (thời gian mặc định là 00:00:00Z), nhưng nếu bạn chỉ định thời gian, bạn cũng phải xác định múi giờ.

Giá trị thẻ không hợp lệ

Sơ đồ trang web của bạn chứa một hoặc nhiều thẻ có giá trị không hợp lệ. Kiểm tra đặc tả cho loại sơ đồ trang web của bạn (chỉ mục, tiêu chuẩn, video, v.v.).

Xem thêm: 7 chỉ số Google Analytics quan trọng nhất để dễ dàng đọc báo cáo |

URL không hợp lệ

Một URL trong sơ đồ trang web của bạn không hợp lệ. Lỗi này có thể là vì URL có chứa ký tự không được hỗ trợ, khoảng trắng hoặc các ký tự khác như dấu trích hoặc có thể có định dạng không chính xác (ví dụ: htp:// thay vì http://).

Hãy đảm bảo rằng các URL có trong sơ đồ trang web của bạn đều được mã hóa để dễ đọc và thoát đúng cách. Bạn nên kiểm tra xem có ký tự không đúng nào như khoảng trắng hay dấu trích hay không. Bạn cũng có thể thử sao chép URL vào một trình duyệt để xem trình duyệt đó có thể hiểu được URL này và tải được trang không.

URL không hợp lệ trong tệp chỉ mục sơ đồ trang web: URL không đầy đủ

Tệp chỉ mục sơ đồ trang web của bạn không bao gồm URL đầy đủ cho mỗi tệp sơ đồ trang web trong chỉ mục. Khi thấy tệp chỉ mục sơ đồ trang web, chúng tôi sẽ tìm các tệp mà chỉ mục tham chiếu trong cùng thư mục đó. Ví dụ: nếu tệp chỉ mục sơ đồ trang web của bạn là http://www.example.com/folder1/sitemap_index.xml và liệt kê một sơ đồ trang web là sitemap.xml (không có / ở đầu), thì chúng tôi sẽ tìm sơ đồ trang web này tại http://www.example.com/folder1/sitemap.xml. Nếu chúng tôi không tìm thấy sơ đồ trang web tại đó, bạn sẽ thấy lỗi này.

Hãy cập nhật tệp chỉ mục sơ đồ trang web của bạn để bao gồm đường dẫn đầy đủ đến từng tệp sơ đồ trang web được liệt kê, sau đó gửi lại.

XML Không hợp lệ: quá nhiều thẻ

Sơ đồ trang web của bạn chứa các thẻ trùng lặp. Ví dụ: mục sau đây sẽ gây ra lỗi này vì thẻ <loc> được liệt kê hai lần:

 <url>  <loc>http://www.example.com/</loc> <loc>http://www.example.com/page1.html</loc>  <lastmod>0796140196</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url>

Thông báo lỗi sẽ cho biết thẻ có vấn đề và số dòng. Hãy xóa thẻ trùng lặp và gửi lại sơ đồ trang web của bạn.

Thiếu thuộc tính XML

Một thẻ trong sơ đồ trang web của bạn bị thiếu một thuộc tính bắt buộc. Kiểm tra sơ đồ trang web của bạn để đảm bảo rằng không có thuộc tính bắt buộc nào bị thiếu. Khi bạn đã sửa giá trị thuộc tính, hãy gửi lại sơ đồ trang web của bạn.

Thiếu thẻ XML

Một hoặc nhiều mục trong sơ đồ trang web của bạn thiếu một thẻ bắt buộc. Thông báo lỗi sẽ liệt kê số dòng. Hãy xem lại trang kiến thức cơ bản về sơ đồ trang web để biết thông tin về thẻ bắt buộc.

URL hình thu nhỏ bị thiếu

Một hoặc nhiều mục video bị thiếu URL cho hình thu nhỏ. Hãy nhờ xác định vị trí của URL của mọi hình thu nhỏ bằng cách sử dụng thẻ <video:thumbnail_loc>.

Thiếu tiêu đề video

Một hoặc nhiều mục video bị thiếu tiêu đề. Hãy đảm bảo mỗi video trong sơ đồ trang web của bạn đều có tiêu đề, được xác định trong thẻ <video:title>.

Định dạng chỉ mục sơ đồ trang web không chính xác: Các chỉ mục sơ đồ trang web ở dạng lồng ghép

Một hoặc nhiều mục nhập trong tệp chỉ mục sơ đồ trang web của bạn sử dụng URL của riêng mục dod hoặc URL của một tệp chỉ mục sơ đồ trang web khác. Một tệp chỉ mục sơ đồ trang web chỉ được liệt kê các tệp sơ đồ trang web, không được liệt kê các tệp chỉ mục sơ đồ trang web khác.

Xóa bất kỳ mục nhập nào trỏ đến tệp chỉ mục sơ đồ trang web rồi gửi lại sơ đồ trang web của bạn.

Lỗi phân tích cú pháp

Google không thể phân tích cú pháp XML của sơ đồ trang web.

Thông thường, vấn đề này do một ký tự không thoát trong URL gây ra. Cũng như đối với tất cả các tệp XML, tất giá trị dữ liệu (bao gồm cả URL) đều phải sử dụng các mã thoát của thực thể cho các ký tự nhất định, chẳng hạn như các ký hiệu & ‘ ” < >. Hãy đảm bảo rằng URL của bạn được thoát đúng cách.

Lỗi tạm thời

Hệ thống của chúng tôi gặp phải vấn đề tạm thời ngăn chúng tôi xử lý sơ đồ trang web của bạn. Nói chung, khi bạn thấy lỗi này, bạn không cần phải gửi lại sơ đồ trang web của bạn. Google có thể cố gắng truy xuất lại sơ đồ trang web của bạn sau này. Nếu lỗi vẫn tồn tại sau vài giờ, hãy thử gửi lại sơ đồ trang web của bạn.

Quá nhiều sơ đồ trang web trong tệp chỉ mục sơ đồ trang web

Tệp chỉ mục sơ đồ trang web của bạn liệt kê hơn 50.000 sơ đồ trang web. Tách chỉ mục sơ đồ trang web của bạn thành nhiều tệp chỉ mục sơ đồ trang web và đảm bảo rằng mỗi danh sách có không quá 50.000 sơ đồ trang web.

Quá nhiều URL trong sơ đồ trang web

Sơ đồ trang web của bạn liệt kê hơn 50.000 URL. Hãy tách sơ đồ trang web của bạn thành nhiều sơ đồ trang web và đảm bảo rằng mỗi sơ đồ chứa không quá 50.000 URL. Bạn cũng có thể sử dụng tệp chỉ mục sơ đồ trang web để quản lý sơ đồ của mình.

Định dạng không được hỗ trợ

Sơ đồ trang web của bạn không có định dạng được hỗ trợ.

Một số lỗi XML thường gặp:

Xem thêm: Redirect domain là gì? Hướng dẫn cách redirect domain hiệu quả nhất

  • Sơ đồ trang web của bạn phải sử dụng tiêu đề chính xác. Ví dụ: nếu sơ đồ trang web của bạn có chứa thông tin video thì sẽ có tiêu đề như sau:
     <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  • Vùng chứa tên trong tiêu đề phải là “http://www.sitemaps.org/schemas/sitemap/0.9” (không phải .9).
  • Tất cả thuộc tính XML phải nằm trong dấu nháy đơn (‘) hoặc dấu ngoặc kép (“) và dấu ngoặc kép đó phải là dấu thẳng thay vì dấu móc. Chương trình xử lý văn bản như Microsoft Word có thể chèn dấu ngoặc móc.

Đường dẫn không khớp: Thiếu www

Đường dẫn tới sơ đồ trang web của bạn không chứa tiền tố www (ví dụ: http://example.com/sitemap.xml), nhưng URL trong sơ đồ trang web của bạn lại có tiền tố đó (ví dụ: http://www.example.com/myfile.html).

Hãy sửa đổi sơ đồ trang web của bạn để xóa “www” khỏi tất cả các URL nhằm khớp với vị trí sơ đồ trang web.

Đường dẫn không khớp: Bao gồm www

Đường dẫn tới sơ đồ trang web của bạn chứa tiền tố www (ví dụ: http://www.example.com/sitemap.xml), nhưng URL trong sơ đồ trang web của bạn lại không có tiền tố đó (ví dụ: http://example.com/myfile.xml).

Hãy sửa đổi sơ đồ trang web của bạn để thêm “www” vào tất cả các URL nhằm khớp với vị trí sơ đồ trang web.

Vùng chứa tên sai

Phần tử gốc của sơ đồ trang web của bạn không có vùng chứa tên chính xác, hoặc vùng chứa tên được khai báo sai hoặc có lỗi chính tả hay URL không chính xác.

Đảm bảo rằng bạn đang sử dụng vùng chứa tên chính xác cho loại tệp của bạn. Ví dụ:

  • Tệp sơ đồ trang web: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • Tệp sơ đồ trang web dành cho video: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • Tệp chỉ mục sơ đồ trang web: <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  • Các loại sơ đồ trang web khác…

Bắt đầu bằng khoảng trắng

Sơ đồ trang web của bạn bắt đầu bằng khoảng trắng, thay vì phần khai báo về vùng chứa tên. Tệp XML phải bắt đầu bằng phần khai báo về XML nhằm xác định phiên bản XML được sử dụng.

Lỗi này sẽ không ngăn Google xử lý sơ đồ trang web của bạn, nhưng bạn nên xóa khoảng trắng để các tệp tuân theo chuẩn XML và bạn không còn thấy lỗi này.

Lỗi HTTP [mã cụ thể]

Google đã gặp phải lỗi HTTP khi tìm cách tải sơ đồ trang web của bạn xuống. Thông báo này sẽ hiển thị mã trạng thái chúng tôi nhận được (ví dụ: 404). Đảm bảo rằng URL của sơ đồ trang web mà bạn chỉ định là đúng và sơ đồ trang web đó có ở vị trí bạn chỉ định. Sau đó, gửi lại sơ đồ trang web của bạn.

Hình thu nhỏ quá lớn

Hình thu nhỏ video được xác định trong sơ đồ trang web của bạn quá lớn. Hãy đổi kích thước hình thu nhỏ video của bạn sang 160 x 120px. Cập nhật sơ đồ trang web của bạn với thông tin mới rồi gửi lại. Tìm hiểu thêm về việc thêm thông tin video vào sơ đồ trang web.

Hình thu nhỏ quá nhỏ

Hình thu nhỏ video được xác định trong sơ đồ trang web của bạn quá nhỏ. Hãy đổi kích thước hình thu nhỏ video của bạn sang 160 x 120px. Cập nhật sơ đồ trang web của bạn nếu cần thiết. Tìm hiểu thêm về việc thêm thông tin video vào sơ đồ trang web.

Vị trí video và vị trí trang phát giống nhau

Trong một sơ đồ trang web video, URL nội dung video và URL trình phát không được giống nhau. Nếu bạn cung cấp cả <video:player_loc> và <video:content_loc> thì các URL phải khác nhau. Tìm hiểu thêm về việc thêm thông tin video vào sơ đồ trang web.

URL vị trí video có vẻ là URL trang phát

Trong sơ đồ trang web video, URL <video:content_loc> trỏ đến trang chứa trình phát. Tìm hiểu thêm về việc thêm thông tin video vào sơ đồ trang web.

Sơ đồ trang web chứa các url bị tệp robots.txt chặn

Google không thể truy cập sơ đồ trang web của bạn, hoặc không thể truy cập vào tất cả các nội dung liệt kê trong sơ đồ trang web của bạn vì bị tệp robots.txt chặn. Hãy sử dụng Công cụ kiểm tra URL để xác nhận tệp nào đang bị chặn và sửa đổi tệp robots.txt của bạn để cho phép Googlebot truy cập vào tệp đó.

Nguồn: https://kienthucthucchien.com
Danh mục: Kiến thức SEO