Crawling / Indexing

Hướng dẫn dùng Supernova Sitemap Generator tạo site map

Posted on March 2, 2010. Filed under: Công cụ seo, Crawling / Indexing, Kỹ năng Webmaster, Liên kết link, Phát triển web, Sitemaps / Structure, Tối Ưu Website |

Chào các bạn , hôm nay mình sẽ hướng dẫn các bạn sử dụng trương trình Supernova Sitemap Generator để tạo site map cho website bạn với tốc độ cực nhanh (more…)

Advertisements
Read Full Post | Make a Comment ( None so far )

Ý nghĩa của một số thẻ meta để làm SEO

Posted on February 25, 2010. Filed under: Crawling / Indexing, Sitemaps / Structure, Tối Ưu Website, Tối ưu nội dung, Thủ thuật seo web, Trùng lặp nội dung |

Meta tag là thẻ dùng để cung cấp các thông tin về website một cách tóm gọn đối với các trình duyệt lẫn người dùng hay bot từ các search engine. Hiện nay, có không ít người đang hiểu sai ý nghĩa của nó và ứng dụng đôi khi không hợp lý trong nhiều website.

Bài viết này sẽ giải thích về ý nghĩa của hầu hết các thẻ Meta tag nhằm giúp các bạn ứng dụng một cách hợp lý hơn và gợi ý các Meta tag bạn nên dùng hoặc không nên dùng.

Meta tag là gì? Đây là thẻ HTML được đặt giữa thẻ    trong của một tài liệu HTML.

Có 2 kiểu sử dụng meta tag thường thấy:

HTML

1. <META HTTP-EQUIV=”name” CONTENT=”content”>

2. <META NAME=”name” CONTENT=”content”>

Ở những thời kỳ đầu khi Meta tags được phát triển nhằm hỗ trợ cho việc phát triển chung của website. Tuy nhiên sau đó việc ứng dụng của nó bị thay đổi lớn, nhiều webmasters đã sử dụng nó một cách thái quá trong việc ứng dụng Meta tags cho keywords (từ khóa) đối với các website có nội dung không lành mạnh.

Rất nhiều từ khóa không liên quan được đặt vào website nhằm giúp cho website đạt kết quả tốt trong kết quả tìm kiếm của các SE. Ví dụ website có nội dung người lớn nhưng lại đặt một số từ khóa liên quan đến các vấn đề nóng hổi khác hoặc về các ngôi sao nổi tiếng mà người dùng thường hay tìm kiếm.

Hiện nay các cỗ máy tìm kiếm đã giảm bớt độ ảnh hưởng của Meta tags cho việc hiển thị kết quả. Google thường bỏ qua sự ảnh hưởng của Meta tags và chỉ sử dụng Google Meta tags (sẽ được giới thiệu dưới đây). Các cỗ máy tìm kiếm khác cũng có cách đọc thẻ này bằng cách riêng của nó.

Sau đây là nội dung giải thích ý nghĩa của các thẻ Meta tags.

I. Các thẻ Meta Tags được khuyến khích sử dụng:

1. Meta Content Language (Dành cho các website không phải tiếng Anh)

Thẻ này được dùng để khai báo ngôn ngữ của website. Thẻ này cũng được dùng tương tự như Meta Name Language. Các robot của SE thường dùng thẻ này để phân loại ngôn ngữ của website.

Ví dụ:

HTML

<META HTTP-EQUIV=”Content-Language” CONTENT=”vi”>

Bạn nên sử dụng thẻ này nếu website của bạn có ngôn ngữ không phải tiếng Anh. Cá nhân tôi chưa từng thử, tuy nhiên theo như những gì mà tôi tham khảo thì thẻ này rất có ích cho bot phân loại nội dung theo ngôn ngữ.

2. Meta Content Type

Thẻ này dùng để khai báo mã cho website. Bạn nên sử dụng thẻ nay ngay cả khi bạn đã dùng khai báo DTD cho tài liệu HTML. Bởi vì nếu bạn không sử dụng thì có khi người dùng website của bạn sẽ không đọc được nội dung website của bạn do trình duyệt không tự động điều chỉnh mã phù hợp cho website của bạn.

Ví dụ: Nội dung website của bạn được nhập liệu thông qua mã UTF-8 nhưng được hiển thị ở chế độ của ISO hay ASCII. Thả này còn có nhiều lợi ích khác, tuy nhiên bạn có thể tự tìm hiểu thêm về vấn đề này thông qua các trang web về SEO.

Ví dụ:

HTML

http-equiv=”Content-Type” content=”text/html; charset=utf-8″>

3. Meta Description

Thẻ này dùng để mô tả nội dung của một trang web. Nội dung của thẻ này nên được viết ngắn gọn và xúc tích khoảng từ 20 đến 25 từ hoặc ít hơn. Đây là thẻ được hầu hết các SE sử dụng để hiển thị nội dung kết quả tìm kiếm.

Ví dụ:

HTML

<META NAME=”description” CONTENT=”Website Khoa học kỹ thuật, giải trí và đời sống dành cho cộng đồng người Việt cùng chia sẽ kinh nghiệm và trao đổi học hỏi.”>

Thẻ này được khuyến khích sử dụng và nên viết một cách xúc tích nhất nhằm thu hút người dùng bấm vào website của bạn từ kết quả tìm kiếm. Thông thường nếu không dùng thẻ này thì các SE như google cũng sẽ tự động tạo khi index nội dung website. Tuy nhiên bạn nên dùng bởi vì đôi khi các mô tả được index tự động sẽ không được như ý của bạn.

4. Meta Language (Dành cho các website không phải tiếng Anh)

Thẻ này tương tự như Meta Content Language nhưng cấu trúc khác như sau:

HTML

<META NAME=”Language” CONTENT=”english”>

II. Các thẻ phụ khác:

Các thẻ sau đây được gọi là thẻ phụ vì cũng được khuyến khích dùng nhưng không thật sự quan trọng, bạn có thể dùng cũng được hoặc không dùng cũng chẳng sao.

1. Meta Abstract

Cung cấp nội dung tóm tắt cho phần mô tả của website. Thẻ này chỉ được dùng để mô tả ngắn gọn hơn để bot có thể xác định được chính xác hơn nội dung website của bạn. Nội dung của thẻ này thường khoảng 10 từ trở lại.

Ví dụ:

HTML

<META NAME=”Abstract” CONTENT=”Website khoa học kỹ thuật, giải trí và đời sống.”>

Thẻ này hiện tại không nằm trong các thuật toán của Google, Yahoo!, và MSN.

2. Meta Author

Thẻ này dùng để hiển thị tác giả của một nội dung trên website. Nội dung của thẻ này thường là tên của người đã tạo ra website. Bạn nên dùng thẻ này bằng tên của mình thay vì dùng email để tránh việc bị spam mail. Nếu bạn muốn người dùng liên hệ với mình thì nên dùng một form để liên hệ sẽ tốt hơn.

Ví dụ:

HTML

<META NAME=”Author” CONTENT=”NGUYEN VU TUAN ANH, myemail@mydomain.com”>

Thẻ này không được index bởi Google, Yahoo!, hay  MSN, do đó cũng không hỗ trợ cho bạn trong việc tăng thứ hạng, nhưng nó được ứng dụng như một chuẩn sử dụng của Meta tag.

3. Meta Copyright

Đây chỉ là thẻ mang tính thương hiệu hay các thông tin bản quyền cá nhân hay sở hữu trí tuệ của bạn.

Ví dụ:

HTML

<meta name=”copyright” content=”Copyright 2008″>

Bạn không nhất thiết phải sử dụng thẻ này bởi vì nó chỉ mang tính tượng trưng và không có nghĩa là nó bảo vệ được bản quyền của bạn.

4. Meta Designer

Thẻ này dùng để cung cấp thông tin về người thiết kế giao diện cho website.

Ví dụ:

HTML

<META NAME=”Designer” CONTENT=”BabyWolf”>

Các SE cũng không sử dụng thẻ này, thẻ này chỉ ứng dụng cho Designer muốn quảng cáo về mình.

5. Meta Google

Thẻ này chỉ được sử dụng cho việc bạn muốn loại bỏ nội dung khỏi google. Các thuộc tính của thẻ này:

Googlebot: noarchive – không cho phép google hiển thị nội dung cache của site bạn.

Googlebot: nosnippet – Không cho phép google hiển thị nội dung trích dẫn hoặc cache.

Googlebot: noindex – Không index những trang web nào đó của bạn.

Googlebot: nofollow – Loại bỏ việc đánh giá PageRank hoặc link từ trang này.

Bạn không nhất thiết phải sử dụng thẻ này ngoại trừ bạn muốn điều khiển google bot theo ý của mình cho cấu trúc website của bạn. Đây là thẻ mà google chắc chắn quan tâm đến. Hoặc bạn cũng có thể ứng dụng các thẻ này trong trường hợp thực tiễn sau: Bạn thay đổi cấu trúc nội dung và đường dẫn website, bạn sẽ vẫn giữ phiên bản cũ nhưng với thẻ này để google sẽ tự động xóa các index tương ứng với link này. Tuy nhiên, tốt nhất bạn nên dùng Redirect Permanently 301 sẽ giúp cho bạn chuyển PageRank từ trang cũ qua trang mới.

6. Meta Keywords

Thẻ từ khóa được dùng để định dạng nội dung trang web. Từ khóa được sử dụng bởi các SE để index site của bạn có thêm thông tin từ các nội dung của title, body, và các thành phần khác. Từ này thường được dùng để cung cấp các từ khóa liên quan đồng nghĩa hoặc tương tự với các từ khóa của title.

Ví dụ: Title của trang web cho bài viết này là “SEO – Ý nghĩa các thẻ meta | Diễn đàn khoa học kỹ thuật”. Bạn có thể ứng dụng keywords như sau:

HTML

<META NAME=”keywords” CONTENT=”khái niệm, quảng bá web, tag, forum, technical, science, thảo luận, trao đổi”>

Bạn nên sử dụng keywords một cách thận trong và bảo đảm sự tương thích với nội dung. Website của bạn có thể bị phạt hoặc đưa vào blacklist nếu bạn quá lạm dụng nó. Việc sử dụng keywords cũng có thể là một con dao hai lưỡi đối với bạn. Bạn có thể mất vài giờ để nghiên cứu cách viết keywords tốt nhất và đối thủ của bạn chỉ mất vài phút để thừa hưởng từ bạn.

7. Meta MSN (No ODP)

Thẻ này được ứng dụng cho việc mô tả website của bạn ở kết quả tìm kiếm của MSN. Do MSN thường hay sử dụng mô tả của DMOZ nên dùng thẻ này sẽ giúp cho MSN chuyển qua dùng mô tả của bạn.

Ví dụ:

HTML

<META Name=”msnbot” CONTENT=”NOODP”>

8. Meta Title

Nội dung thẻ này được sử dụng tương tự như thẻ title .

Ví dụ:

HTML

<META NAME=”Title” CONTENT=”Page Title Here”>

Thẻ này được sử dụng bởi Yahoo! và MSN.

Read Full Post | Make a Comment ( None so far )

Ý nghĩa các thẻ META trong HTML SEO

Posted on February 24, 2010. Filed under: Crawling / Indexing, Kỹ năng Webmaster, SEO trên web, Tối Ưu Website, Tối ưu nội dung, Từ khóa Hot, Thủ thuật seo web, Trùng lặp nội dung |

Bài viết này nhằm cung cấp thêm thông tin về ý nghĩa của các thẻ trên để giúp bạn lưu ý khi quyết định sử dụng các thẻ này từ một số website cung cấp nguồn thông tin không chính xác.

  1. Meta Content Script Type
  2. Meta Content Style Type
  3. Meta Distribution
  4. Meta Expires
  5. Meta Generator
  6. Meta MS Smart Tags
  7. Meta Pragma No-Cache
  8. Meta Publisher
  9. Meta Rating
  10. Meta Refresh
  11. Meta Reply-To
  12. Meta Resource Type
  13. Meta Revisit After
  14. Meta Robots
  15. Meta Set Cookie
  16. Meta Subject
  17. Meta Content Script Type

Thẻ này được dùng để cho biết các mã script sử dụng trong tài liệu HTML là gì. Ví dụ:

HTML

<META HTTP-EQUIV=”Content-Script-Type” CONTENT=”text/javascript”>

Thẻ này bạn không cần dùng bởi vì các bot của SE dùng có cách riêng của nó để nhận biết được script trong HTML của bạn là loại gì. Ngoài ra các trình duyệt (browser) cũng được phát triển các phương thức riêng để nhận biết loại script trong HTML.

Meta Content Style Type

Thẻ này được dùng để cho biết kiểu (style) bạn dùng để định dạng văn bản là loại gì. Ví dụ:

HTML

<META HTTP-EQUIV=”Content-Style-Type” CONTENT=”text/css”>

Tương tự như trên thì thẻ này cũng không cần thiết phải dùng.

Meta Distribution

Thẻ này dùng để khai báo thông tin rằng nội dung web của bạn được phân bố trong phạm vi thế nào. Có 3 loại lựa chọn cho thẻ này:

Global (toàn bộ website)

Local (Chỉ dùng cho nhóm ip của website)

IU (Internal Use – Sử dụng nội bộ, không public ra ngoài).

Ví dụ sử dụng:

HTML

<META NAME=”Distribution” CONTENT=”Global”>

Thẻ này bạn cũng không cần phải dùng đến vì nếu để giới hạn phạm vi sử dụng thì bạn có thể dùng robots.txt hoặc .htaccess.

Meta Expires

Thẻ này dùng để thông báo thời gian trang nội dung của bạn sẽ bị hết hạn.

Cách sử dụng như sau:

HTML

<META HTTP-EQUIV=”expires” CONTENT=”Wed, 26 Feb 2004 08:21:57 GMT”>

Thẻ này bạn cũng không cần thiết phải sử dụng vì những bot ví dụ như Google cũng chẳng quan tâm đến và mặc dù bạn có để thẻ này thì google vẫn cache website của bạn như thường. Vì vậy bạn không cần phải mất thời gian quan tâm đến thẻ này.

Meta Generator

Thẻ này dùng để cung cấp thông tin về công cụ bạn dùng để tạo ra tài liệu HTML của bạn.

Ví dụ:

HTML

<META NAME=”Generator” CONTENT=”FrontPage 4.0″>

Ngay cả về ý nghĩa của nó bạn đã thấy điều này hoàn toàn chẳng cần thiết và bạn cũng nên xóa nó đi nếu như công cụ bạn dùng tạo ra nó để nhìn cho gọn gàng hơn và tập trung vào những thứ cần thiết.

Meta MS Smart Tags

Thẻ này được Microsoft phát triển trong một bản beta của trình duyệt IE nhưng sau đó phải bỏ đi do người dùng không thích những thẻ này. Về ý nghĩa của thẻ này chắc hẳn bạn nghe thấy cũng đã hết muốn dùng bởi ví nó phục vụ chính cho mục đích quảng cáo của Microsoft hơn là dành cho người dùng. Khi thẻ này được khai báo thì trình duyệt sẽ tự động chèn vào các đường link mà không phải do tác giả tạo ra.

Cấu trúc sử dụng như sau:

HTML

<META NAME=”MSSmartTagsPreventParsing” CONTENT=”TRUE”>

Theo các tài liệu về SEO mới hiện nay chắc cũng chẳng có nơi nào khuyến khích việc dùng thẻ này hay rất hiếm khi đề cập đến thẻ này. Nếu bạn đang sử dụng dịch vụ SEO của một công ty nào đó mà công ty này dùng thẻ này thì bạn nên chọn dịch vụ của công ty khác là vừa.

Meta Pragma No-Cache

Thẻ này được dùng để báo cho trình duyệt biết tất cả các đối tượng trong web của bạn đều phải được load từ server chứ không dùng cache. Các SE không quan tâm đến thẻ này, ý nghĩa của nó chỉ đơn thuần là hướng tới người dùng. Giả sử như javascript, css hay hình ảnh bạn thường xuyên thay đổi mà muốn người dùng nhìn thấy phiên bản mới thì mới dùng trong mục đích này.

Cách sử dụng:

HTML

<META HTTP-EQUIV=”Pragma” CONTENT=”no-cache”>

Tuy nhiên việc lúc nào cũng truy xuất đến server của bạn cũng sẽ làm ảnh hưởng rất lớn đến hiệu suất hoạt động của server và website của bạn tất nhiên sẽ hoat động chậm hơn do server của bạn phải phản hồi lượng request nhiều hơn.

Meta Publisher

Thẻ này tương tư như thẻ Meta Generator với cách sử dụng như sau:

HTML

<META NAME=”Publisher” CONTENT=”FrontPage 4.0″>

Meta Rating

Thẻ này không được đề cập đến từ W3C và chỉ dùng để hiển thị cho điểm đánh giá nội dung website của bạn. Cách sử dụng cũng không rõ ràng và bot cũng không quan tâm đến thẻ này.

Meta Refresh

Thẻ này được dùng để khai báo cho trình duyệt biết thời gian để tự động chuyển đến một trang khác. Cấu trúc sử dụng như sau:

HTML

<META HTTP-EQUIV=”Refresh” CONTENT=”3;URL=http://www.domain.com/page.html”>

Với những trang HTML có chứa thẻ như trên thì sẽ tự động chuyển đến trang web http://www.khkt.net sau thời gian 3 giây. Theo thông tin tôi được biết thì bot có khả năng đọc được thẻ này và việc ứng dụng nó có thể bị cho là spam. Nếu muốn dùng thẻ này bạn nên dùng chức năng chuyển trang 301 hoặc 302.

Meta Reply-To

Thẻ này không nên dùng vì dễ dàng tạo điều kiện cho các spammers gửi email đến bạn và mục đích của thẻ này chỉ nhằm để cho biết ai là người sẽ chịu trách nhiệm nhận email cho hệ thống website của bạn.

Cách sử dụng:

HTML

<meta name=”reply-to” content=”your.email@address.com” />

Meta Resource Type

Thẻ này được dùng để khai báo kiểu dữ liệu cho trang web của bạn. Bạn không cần thiết phải dùng thẻ này, thay vì dùng thẻ này bạn nên dùng kiểu khai báo của các DTD sẽ tốt hơn.

HTML

<META name=”resource-type” content=”document”>

Meta Revisit After

Thẻ này theo một số thông tin cho biết được dùng để khai báo cho bot biết nên quay lại lúc nào để cập nhật thông tin website của bạn nhưng điều này thật sự không chính xác bởi vì các bot đều viếng thăm website của bạn theo chu kỳ lịch trình riêng của nó. Vì vậy bạn cũng không cần phải sử dụng thẻ này.

HTML

<META NAME=”Revisit-After” CONTENT=”30 days Days”>

Meta Robots

Thẻ này mục đích chỉ để thông báo cho bot biết có nên index lại nội dung hay không, các liên kết trong website đó có cần phải ghi nhận lại hay không.

Các sử dụng:

HTML

<META NAME=”ROBOTS” CONTENT=”NOINDEX,FOLLOW”>

Thay vì dùng thẻ này thì bạn nên dùng .htaccess hoặc robots.txt sẽ tốt hơn. Có một số ý kiến cho rằng file robots.txt sẽ không được đọc đến nếu như bot đi từ trang trong chứ không phải trang chính, điều này không đúng. Để kiểm nghiệm bạn có thể xem logs website của mình.

Meta Set Cookie

Thẻ này bạn không cần thiết phải dùng bởi vì nó đã quá xưa rồi và các ngôn ngữ lập trình server side hỗ trợ tốt hơn nhiều cho việc lưu thông tin cookie thay vì phải dùng qua thẻ của HTML.

Ví dụ sử dụng:

HTML

<META HTTP-EQUIV=”Set-Cookie” CONTENT=”cookievalue=xxx;expires=Wednesday, 21-Oct-98 16:14:21 GMT; path=/”>

Meta Subject

Thẻ này để khai báo chủ đề của website. Cách sử dụng:

HTML

<META NAME=”Subject” CONTENT=”Web Page Subject”>

Bạn không cần thiết phải dùng thẻ này do cả trình duyệt lẫn bot đều không hỗ trợ cho thẻ này.

Read Full Post | Make a Comment ( None so far )

Clip hướng dẫn submit url lên google

Posted on February 24, 2010. Filed under: Công cụ seo, Crawling / Indexing, Kỹ năng Webmaster, Phát triển web, Tối Ưu Website |

Tut Seo video 24hseo.com – Quảng bá website – Quảng cáo website

Hướng dẫn add url website lên googleĐầu tiên các bạn truy cập vào link : http://google.com/addurl

URL: Gõ tên website của bạn , Vd : http://24hseo.com

Comments: Gõ các từ khóa bạn muốn submit ( đăng kí lên công cụ tìm kiếm ) sau đó nhập mã xác nhận và lick add url để đăng kí website lên google
Thank youYour site URL has been successfully added to our list of URLs to crawl. Please note that we do not add all submitted URLs to our index, and we cannot make any predictions or guarantees about when or if they will appear.
You may also be interested in Google webmaster tools, which shows you Google’s view of your site, helps you diagnose problems, and lets you share information with us to help improve your site’s visibility in our search results
Bạn đã đăng kí thành công Chúc các bạn khởi đầu với công việc quảng cáo website

Read Full Post | Make a Comment ( None so far )

Title – cách tối ưu như thế nào hiệu quả ?

Posted on February 22, 2010. Filed under: Crawling / Indexing, Kỹ năng Webmaster, Tối Ưu Website, Tối ưu nội dung, Trùng lặp nội dung |

Tại sao title lại quan trọng?

  • Đơn giản đó là nơi bạn click để đi đến trang được tìm kiếm trên SE, thể hiện phần nào sự liên quan đến keyword.
  • Là nơi đầu tiên mà các spider, webcrawler thấy khi bắt đầu quá trình scan.
  • Nói cho các SE (hoặc là user) biết site bạn đang nói về cái gì.
  • Title tốt có thể giúp chúng ta hiển thị và đứng vững tốt trên SERPs cho mỗi lần có truy vấn, điều đó đồng nghĩa mang lại thêm nhiều khách hàng (user) tìm năng.

Write Highly Optimized Title Tags Title Tags cách tối ưu như thế nào?

Có thể tìm Titles Page ở đâu?

Trên SERPs…

Page Titles in the SERPs Title Tags cách tối ưu như thế nào?

Trên trình duyệt…

freelancer title page Title Tags cách tối ưu như thế nào?

Trong Source Code…

source code title page Title Tags cách tối ưu như thế nào?

Vậy làm sao để có thể tạo Titles Page thân thiện?

1. Add keyword chủ đạo, loại bỏ các keyword không liên quan đến nội dung.

2. Giới hạn mỗi title không quá 70 kí tự

Page Titles in the SERPs with character Title Tags cách tối ưu như thế nào?

3.  Trừ khi tên công ty hay doanh nghiệp chúng ta đã quá nổi tiếng (vd: FTP, Chợ điện tử, Trung Nguyên Coffee,…) không thì nên đặt cuối cùng hoặc chăng bỏ ra khỏi keyword. Nếu tên doanh nghiệp chúng ta mang luôn keyword, còn khi đã SEO Title tốt thì như “nhất tiển song điêu” người dùng sẽ biết đến chúng ta mà thôi, không việc gì phải tốn không gian cho việc không nhất thiết phải làm.

4. Cố gắng là duy nhất

Hiện nay sản phẩm + các hình thức kinh doanh của các công ty gần như rất giống nhau cho nên keyword cũng có hiện tượng tương tự. Hãy cố gắng keyword của chúng ta là gần như duy nhất trong cái mớ bòng bong đó nhưng vẫn đảm bảo được tính khả dụng cao. Nên tìm kiếm sự giúp đỡ từ 1 copywritter là 1 suy nghĩ không tồi.

mèo Tom

Read Full Post | Make a Comment ( None so far )

TrustRank – Một yếu tố ảnh hưởng đến thứ hạng trên Google

Posted on December 8, 2009. Filed under: Crawling / Indexing, Kỹ năng Webmaster, Phát triển web, SEO trên web, Tối Ưu Website, Tối ưu nội dung, Thủ thuật seo web | Tags: , , , , , , , |

Vào năm 2004, các chuyên gia của Yahoo đã đưa ra một tài liệu về TrustRank, miêu tả một thuật toán cho phép sử dụng công cụ tìm kiếm để quyết định tính xác đáng trong kết quả tra cứu.
Trái lại với thuật toán tiền để của PageRank, TrustRank không đơn thuần là tính số lượng link đến 1 website mà nó còn xem xét đến uy tín của website đó.
TrustRank đưa ra nhằm mục đích loại bỏ spam trong kết quả search.
Trích dẫn sau đây của tài liệu này chỉ ra rằng PageRank cũng là một công cụ để chống lại các spam trên web.
“Các spam web có rất nhiều thủ thuật để có được thứ hạng hơn thực chất của họ ở kết quả của công cụ tìm kiếm. Dù những chuyên gia mạng có thể xác định spam nhưng việc thao tác thủ công trên một số lượng lớn website đòi hỏi chi phí rất cao.Thay vào đó, chúng tôi đưa ra những kỹ thuật bán tự động phân loại những website tốt, có uy tín khỏi những site spam.
Ban đầu chúng tôi chọn ra một nhóm các seed site (tạm dịch site hạt giống) để các chuyên gia phân tích đánh giá. Bằng cách thủ công phân tích các web đó, chúng tôi dùng cấu trúc link của website để tìm ra những site tốt khác.
Kết quả có được cho thấy rằng chúng tôi có thể lọc ra những spam site một cách hiệu quả từ phân đoạn web trên cơ sở tập hợp gần 200 site.”
Ngày nay, hầu hết các công cụ tìm kiếm đều sử dụng các loại hình TrustRank.
Dù Google không dùng thuật ngữ chính thức này, nhưng hầu như các chuyên gia tối ưu hóa công cụ tìm kiếm khá chắc chắn rằng Google và toàn bộ các công cụ tìm kiếm lớn khác cũng có chung quan niệm về việc nâng cao chất lượng kết quả search của họ. Điều đó có nghĩa rằng có được càng nhiều link càng tốt thôi chưa đủ. Mà điều cần thiết là website của bạn phải có link từ những website thích hợp, uy tín và công cụ tìm kiếm tin tưởng site của bạn.
Làm thế nào để website của bạn trở nên đáng đáng tin cậy:
1. Tìm cách tạo link từ những seed site hoặc từ những website được link từ seed site đó.
Seed site là những website được công cụ tìm kiếm ghi nhận là đáng tin cậy. Ví dụ, nếu Apple.com được chọn là 1 seed website bởi công cụ tìm kiếm, thì 1 link từ Apple.com tới 1 website sẽ có tác dụng tích cực tới TrustRank của website đó.. Nếu Apple.com link tới website X, mà website X đó lại link tới 1 website Y và website Y link tới site của bạn, thì khi đó site của bạn sẽ có được TrustRank tốt.
2. Lấy một domain cũ có lịch sử domain tốt:
Domain của bạn càng cũ càng tốt. Nếu domain đã có được vài năm, thì đó là dấu hiệu cho thấy webmaster có mục đích nghiêm túc về site đó và dường như có ít khả năng nó được dùng cho mục đích spam. Tên miền không nên thay chủ sở hữu quá nhiều và cũng không nên dùng cho quá nhiều topic khác nhau. Tất nhiên trước đó nó cũng không từng bị sử dụng cho mục đích spam.
3. Lấy link từ những website có liên quan.
Website của bạn có link từ những website tương tự hay không? Website của bạn là một quốc đảo cô lập mà không hề có liên hệ qua lại với những trang khác, hay nó liên kết với một hệ thống site cùng liên quan tới một lĩnh vực đặc biệt nào đó?
4. Không link tới những website spam
Bạn không nên link tới những site được biết tới là spam hoặc những site chất lượng đáng ngờ, không rõ ràng. Nếu bạn link tới những site như vậy đồng nghĩa với việc khiến công cụ tìm kiếm cho rằng bạn ủng hộ spam web và chắc chắn web của bạn sẽ không được tin cậy.
5. Cố gắng kiếm nhiều link từ những trang mạng xã hội:
Mức độ website của bạn được nhắc tới trên các website truyền thông đại chúng càng thường xuyên thì càng chứng tỏ được site của bạn có chất lượng cao và đáng tin cậy. Và cũng càng tốt khi có được nhiều vote cho bookmark của bạn trên những trang xã hội đó.
6. Cung cấp nội dung có chất lượng và hạn chế liên quan tới một số topic nhất định.
Không phải rằng một website chỉ gồm 1 trang là website đáng tin cậy. Nếu website của bạn có nhiều trang chứa đựng nội dung hay và chất lượng về một topic riêng biệt nào đó thì việc có được TrustRank tốt dễ dàng hơn nhiều.
Khi website của bạn liên quan đến một chủ đề đặc biệt thì cũng có thể là bạn sẽ chả bao giờ có được TrustRank cao, vì những topic này lại là những topic bị spam bằng email nhiều nhất.
Bạn cũng dễ dàng có được rank cao khi được công cụ tìm kiễm tin cậy. Nếu bạn muốn tìm ra liệu rằng website của bạn đã có tất cả các yếu tố cần để có được thứ hạng cao trên Google, Yahoo, Bing và những trang tìm kiếm khác hay chưa, hãy phân tích website của bạn bằng công cụ tối đa hóa Top 10 của IBP.

Vào năm 2004, các chuyên gia của Yahoo đã đưa ra một tài liệu về TrustRank, miêu tả một thuật toán cho phép sử dụng công cụ tìm kiếm để quyết định tính xác đáng trong kết quả tra cứu.

Trái lại với thuật toán tiền để của PageRank, TrustRank không đơn thuần là tính số lượng link đến 1 website mà nó còn xem xét đến uy tín của website đó.

TrustRank đưa ra nhằm mục đích loại bỏ spam trong kết quả search. (more…)

Read Full Post | Make a Comment ( None so far )

Các công cụ phân tích từ khóa trực tuyến tốt nhất

Posted on November 13, 2009. Filed under: Công cụ seo, Crawling / Indexing, Kỹ năng Webmaster, Liên kết link, SEO trên web, Sitemaps / Structure, Tối Ưu Website, Tối ưu nội dung, Từ khóa Hot, Thông tin tìm kiếm, Thủ thuật SEO Blog, Thủ thuật seo web, Trùng lặp nội dung, Xếp hạng google | Tags: , , , , , , , , |

Hiện nay có khá nhiều công cụ nghiên cứu từ khoá dành cho SEO. Trong bảng xếp hạng những công cụ được yêu thích nhất năm 2007, Keyword Discovery dẫn đầu với 18% lượng người dùng.
Dưới đây là danh sách bầu chọn 10 công cụ nghiên cứu từ khoá được yêu thích nhất:
Sau đây là chi tiết một số công cụ phổ biến:
Keyword Discovery
Dữ liệu từ khoá của Keyword Discovery được biên dịch và chọn lựa từ một số công cụ tìm kiếm nhằm cung cấp dữ liệu một cách chính xác nhât. Điểm nổi bật của Keyword Discovery là nó được sử dụng miễn phí. Hãy đánh từ khoá vào ô tìm kiếm, Keyword Discovery sẽ hiện thị 100 kết quả hàng đầu cho bạn.
Bạn sử dụng miễn phí tại đây!
Wordtracker
So với Keyword Discovery, công nghệ của Wordtracker không hề thua kém, bất lợi lớn nhất của Wordtracker đối với đa số người dùng là phải trả chi phí khi dùng nó. Bạn có thể dùng bản trial 7 ngày tại đây.
Google Keyword Tool
Đây cũng là bản được sử dụng miễn phí. Ngoài việc liệt kê ra các keywords, Google Keyword Tool còn cho phép tìm các từ khoá liên quan đến nội dung trên một trang bằng cách nhập vào đường dẫn URL của Website đó.
Bạn có thể sử dụng miễn phí tại đây.
SEO Digger
Với Seodigger.com, bạn có thể tìm ra các từ khoá nào mà Website của bạn có thể được rank lên top 20 của Google. Bạn có thể phần tích site của bạn cũng như các trang của đối thủ cạnh tranh, sử dụng thông tin đạt được từ việc phần tích SEO. Hiện nay, SEO Digger đang cho dùng thử bản Beta.
Overture Keyword Selector
Khi bạn nhập vào một thuật ngữ liên quan trên site của bạn, Overture Keyword Selector sẽ hiện thị những kết quả tìm kiếm liên quan đến thuật ngữ bạn tìm và thuật ngữ này đã được tìm kiếm bao nhiêu lần trong tháng trước.
Theo Vietnambiz

Hiện nay có khá nhiều công cụ nghiên cứu từ khoá dành cho SEO , Keyword Discovery dẫn đầu với 18% lượng người dùng.

Dưới đây là danh sách bầu chọn 10 công cụ nghiên cứu từ khoá được yêu thích nhất:

Sau đây là chi tiết một số công cụ phổ biến:

Keyword Discovery

Dữ liệu từ khoá của Keyword Discovery được biên dịch và chọn lựa từ một số công cụ tìm kiếm nhằm cung cấp dữ liệu một cách chính xác nhât. Điểm nổi bật của Keyword Discovery là nó được sử dụng miễn phí. Hãy đánh từ khoá vào ô tìm kiếm, Keyword Discovery sẽ hiện thị 100 kết quả hàng đầu cho bạn.

Bạn sử dụng miễn phí tại đây!

Wordtracker

So với Keyword Discovery, công nghệ của Wordtracker không hề thua kém, bất lợi lớn nhất của Wordtracker đối với đa số người dùng là phải trả chi phí khi dùng nó. Bạn có thể dùng bản trial 7 ngày tại đây.

Google Keyword Tool

Đây cũng là bản được sử dụng miễn phí. Ngoài việc liệt kê ra các keywords, Google Keyword Tool còn cho phép tìm các từ khoá liên quan đến nội dung trên một trang bằng cách nhập vào đường dẫn URL của Website đó.

Bạn có thể sử dụng miễn phí .

SEO Digger

Với Seodigger.com, bạn có thể tìm ra các từ khoá nào mà Website của bạn có thể được rank lên top 20 của Google. Bạn có thể phần tích site của bạn cũng như các trang của đối thủ cạnh tranh, sử dụng thông tin đạt được từ việc phần tích SEO. Hiện nay, SEO Digger đang cho dùng thử bản Beta.

Overture Keyword Selector

Khi bạn nhập vào một thuật ngữ liên quan trên site của bạn, Overture Keyword Selector sẽ hiện thị những kết quả tìm kiếm liên quan đến thuật ngữ bạn tìm và thuật ngữ này đã được tìm kiếm bao nhiêu lần trong tháng trước.

Theo Vietnambiz

Read Full Post | Make a Comment ( None so far )

Hướng dẫn Tối ưu hóa kích thước và số liên kết trang Web

Posted on November 13, 2009. Filed under: Crawling / Indexing, Kỹ năng Webmaster, Liên kết link, SEO trên web, Tối Ưu Website, Tối ưu nội dung, Từ khóa Hot, Thông tin tìm kiếm, Thủ thuật SEO Blog, Thủ thuật seo web | Tags: , , , , , , , , , , , |

Như các bạn đã biết, quảng bá Web gồm hai công việc chính đó là tối ưu hóa các yếu tố trên trang và các yếu tố bên ngoài trang. Nếu như các yếu tố bên ngoài trang như việc xây dựng liên kết chẳng hạn phụ thuộc vào nhiều yếu tố bên ngoài thì các yếu tố trên trang lại hoàn toàn có thể tùy biến tối ưu theo ý muốn. Trước khi đi vào tối ưu chi tiết các yếu tố như tiêu đề, mã nguồn và thẻ meta tags, kỹ thuật sử dụng, thì bạn luôn đặt câu hỏi : Liệu dung lượng trang bao nhiêu thì tối ưu nhất ? Bao nhiều liên kết trên trang thì vừa đủ ?
Tối ưu hóa kích thước trang và số liên kết
Kích thước trang (PageSize)
Hiện nay với công nghệ hiện đại đem đến một tốc độ băng thông internet cực cao, nên bạn không cần phải quan tâm đến page size.
Vấn đề không phải hoàn toàn như vậy, dù với băng thông lớn đến cỡ nào thì nhu cầu của con người là không đủ. Nếu lượng khách viếng thăm của bạn là khiêm tốn thì không nói làm gì, nhưng nếu Website của bạn thu hút một lượng khách hàng lớn thì tổng dung lượng số trang được xem lại là rất lớn. Chưa kết đến tốc độ truy cập tại một số nơi còn hạn chế và vấn đề hiển thị trên tình duyệt cũng mất nhiều thời gian hơn với những trang Web có dung lượng lớn hơn.
Theo các chuyên gia SEO thì bạn nên giới hạn kích thước của trang dưới hơn 150kB. Googlebot hoạt động trên 1 quỹ tài nguyên nhất định, nếu nó phải dành nhiều thời gian để đánh chỉ số hình ảnh và file pdf thì sẽ còn rất ít thời gian dành cho những phần khác.
Nội dung văn bản
Phần nội dung không nên dài quá 1000 từ.
Thực ra thì không có chuẩn mực nào dành cho độ dài của phần nội dung. Bạn có thể sử dụng 2000 hay 3000 từ, Google có thể đánh chỉ số tốt các Website chứa nội dung văn bản khá dài, mà điển hình các trang của W3C (qui định các chuẩn World Wide Web) đều có kích thước văn bản rất lớn. Vấn đề bạn cần làm là đảm bảo những phần nội dung hướng tới sự thoải mái của người đọc, phần còn lại crawler sẻ đảm nhận được tất.
Số lượng liên kết trên một Website
Google không thể crawl hơn 100 links trên 1 trang.
Trên blog của Mattcutts đã có bài viết về vấn đề này, cũng trong bài viết này Mr Mattcutts đã đề cập rằng google đã từ lâu nâng cao khả năng crawl của spider lên trên 100 link/1trang. Nhưng Google sẽ đánh chỉ số dễ dàng hơn nếu tổng số liên kết dưới 100 liên kết/trang. Ngoài ra bạn có thể dồn thế liên kết vào các phần nội dung quan trọng hơn.
Các công cụ tối ưu hóa kích thước trang
Một số công cụ giúp bạn phân tích và định lượng page site:
Theo thống kế của eMarketing thực hiện năm 2008, thì có đến 16% trên tổng lượng truy cập vào website của bạn sẻ rời website nếu họ phải chờ trên 10 giây, và gấp đôi số đó nếu họ phải chờ trên 15 giây (theo số liệu thông kê của eMarketing). Vì vậy, cải thiện tốc độ tải trang là việc hết sức quan trọng
Giải pháp tốt nhất là cố gắng nâng cao khẳ năng hiệu dụng của server và giảm kích thước trang. Khoảng tầm 150k là vừa, nếu dưới 100k thì tốt hơn.
Các bạn có thể tham khảo một số công cụ sau :
Website Optimization Analyze
Web Page Speed Report
Page Size Extractor
Web Developer FireFox Extension
Các trang này đều có thẻ cho bạn các thông số về kích thước tổng cộng, kích thước từng thành phần mã nguồn HTML, hình ảnh, tệp tin đa phương tiện, CSS, số liên kết v.v. cũng như  các khuyến nghị tối ưu. Từ  đó bạn có thể có cái nhìn tổng quát nhất về Website để có quyết định tối ưu phù hợp.

Như các bạn đã biết, công việc quảng bá Web gồm hai công việc chính đó là tối ưu hóa các yếu tố trên trang và các yếu tố bên ngoài trang. Nếu như các yếu tố bên ngoài trang như việc xây dựng liên kết chẳng hạn phụ thuộc vào nhiều yếu tố bên ngoài thì các yếu tố trên trang lại hoàn toàn có thể tùy biến tối ưu theo ý muốn. Trước khi đi vào tối ưu chi tiết các yếu tố như tiêu đề, mã nguồn và thẻ meta tags, kỹ thuật sử dụng, thì bạn luôn đặt câu hỏi : Liệu dung lượng trang bao nhiêu thì tối ưu nhất ? Bao nhiều liên kết trên trang thì vừa đủ ?

Tối ưu hóa kích thước trang và số liên kết

Kích thước trang (PageSize)

Hiện nay với công nghệ hiện đại đem đến một tốc độ băng thông internet cực cao, nên bạn không cần phải quan tâm đến page size.

Vấn đề không phải hoàn toàn như vậy, dù với băng thông lớn đến cỡ nào thì nhu cầu của con người là không đủ. Nếu lượng khách viếng thăm của bạn là khiêm tốn thì không nói làm gì, nhưng nếu Website của bạn thu hút một lượng khách hàng lớn thì tổng dung lượng số trang được xem lại là rất lớn. Chưa kết đến tốc độ truy cập tại một số nơi còn hạn chế và vấn đề hiển thị trên tình duyệt cũng mất nhiều thời gian hơn với những trang Web có dung lượng lớn hơn.

Theo các Chuyên Gia SEO thì bạn nên giới hạn kích thước của trang dưới hơn 150kB. Googlebot hoạt động trên 1 quỹ tài nguyên nhất định, nếu nó phải dành nhiều thời gian để đánh chỉ số hình ảnh và file pdf thì sẽ còn rất ít thời gian dành cho những phần khác.

Nội dung văn bản

Phần nội dung không nên dài quá 1000 từ.

Thực ra thì không có chuẩn mực nào dành cho độ dài của phần nội dung. Bạn có thể sử dụng 2000 hay 3000 từ, Google có thể đánh chỉ số tốt các Website chứa nội dung văn bản khá dài, mà điển hình các trang của W3C  (qui định các chuẩn World Wide Web) đều có kích thước văn bản rất lớn. Vấn đề bạn cần làm là đảm bảo những phần nội dung hướng tới sự thoải mái của người đọc, phần còn lại crawler sẻ đảm nhận được tất.

Số lượng liên kết trên một Website

Google không thể crawl hơn 100 links trên 1 trang.

Trên blog của Mattcutts đã có bài viết về vấn đề này, cũng trong bài viết này Mr Mattcutts đã đề cập rằng google đã từ lâu nâng cao khả năng crawl của spider lên trên 100 link/1trang. Nhưng Google sẽ đánh chỉ số dễ dàng hơn nếu tổng số liên kết dưới 100 liên kết/trang. Ngoài ra bạn có thể dồn thế liên kết vào các phần nội dung quan trọng hơn.

Các công cụ tối ưu hóa kích thước trang

Một số công cụ giúp bạn phân tích và định lượng page site:

Theo thống kế của eMarketing thực hiện năm 2008, thì có đến 16% trên tổng lượng truy cập vào website của bạn sẻ rời website nếu họ phải chờ trên 10 giây, và gấp đôi số đó nếu họ phải chờ trên 15 giây (theo số liệu thông kê của eMarketing). Vì vậy, cải thiện tốc độ tải trang là việc hết sức quan trọng

Giải pháp tốt nhất là cố gắng nâng cao khẳ năng hiệu dụng của server và giảm kích thước trang. Khoảng tầm 150k là vừa, nếu dưới 100k thì tốt hơn.

Các bạn có thể tham khảo một số công cụ sau :

Website Optimization Analyze

Web Page Speed Report

Page Size Extractor

Web Developer FireFox Extension

Các trang này đều có thẻ cho bạn các thông số về kích thước tổng cộng, kích thước từng thành phần mã nguồn HTML, hình ảnh, tệp tin đa phương tiện, CSS, số liên kết v.v. cũng như  các khuyến nghị tối ưu. Từ  đó bạn có thể có cái nhìn tổng quát nhất về Website để có quyết định tối ưu phù hợp.

Read Full Post | Make a Comment ( None so far )

Những bước cơ bản để tự SEO quảng bá website

Posted on June 24, 2009. Filed under: Công cụ seo, Crawling / Indexing, Kỹ năng Webmaster, Phát triển web, SEO trên web, Sitemaps / Structure, Tối Ưu Website, Tối ưu nội dung, Từ khóa Hot, Thông tin tìm kiếm, Thủ thuật SEO Blog, Thủ thuật seo web, Trùng lặp nội dung | Tags: , , , , , , , , , , , , , |

Quảng cáo website là một phương pháp cơ bản xây dựng thương hiệu, quảng cáo sản phẩm, dịch vụ trực tuyến. Quảng cáo website là một khâu then chốt, quyết định thành bại khi xây dựng kênh phân phối sản phẩm, dịch vụ trực tuyến. Là phương pháp xúc tiến thương mại toàn cầu không thể thiếu đối với các doanh nghiệp xuât nhập khẩu.

Nếu phân tích sâu hơn thì quảng cáo website, hay marketing website, là việc nghiên cứu các phương pháp quảng cáo trực tuyến, sử dụng các công cụ, thủ thuật, và xây dựng nội dung cho website hay nói cách khác là tối ưu hóa nội dung website của bạn với với những từ khoá (keywords) đã được nghiên cứu từ trước.

1. Submit website

Một cách nhanh nhất để google biết tới website của bạn là liên kết với những website khác. Nhất là khi bạn liên kết được với những website có pagerank cao, được google update thường xuyên. Khi đó site của bạn sẽ được index trong vòng 1 tuần trở lại. Một vài search engine sẽ đánh giá cao website được list trên các directory có uy tín, điều đó giải thích tại sao việc submit site bạn vào directory là rất cần thiết. Đừng quên submit địa chỉ web của bạn tới Google

Ngoài ra còn có rất nhiều những directory miễn phí để bạn submit như:>

  • Yahoo (phí $299/năm)
  • -DMOZ miễn phí
  • Jayde B2B miễn phí
  • GoGuides miễn phí
  • Zeal miễn phí.

2. Tạo sitemap

Sitemap là 1 file giúp spider có thể biết được trang web của bạn bao gồm những mục nào.
Sitemap bắt buộc phải có:

  • Bắt đầu với tag và kết thúc với tag.
  • Bao gồm 1 cho từng đường link.
  • Bao gồm 1 cho từng tag.

Hiện nay hầu hết các spider đều tuân theo chuẩn của Google sitemap

Hiện nay có nhiều mã nguồn hỗ trợ tạo sitemap tự động, bạn có thể tham khảo công cụ tạo sitemap.
Sau khi tạo xong sitemap. Bạn cần tạo 1 tài khoản tại http://google.com/webmastervà add site map vào đó.

3. Tối ưu hóa website

Kiểm tra lại mã html của bạn đã được validate chưa tại http://validator.w3.org Sau đó kiểm tra nội dung đã chứa những từ khóa quan trọng đối với trang web của bạn chưa. Nên nhớ tiêu đề bài viết nên có chứa những từ khóa sẽ rất quan trọng cho việc từ khóa đó có rank bao nhiêu.

4. Tránh sử dụng file Flash


Hầu hết các spider như google hay yahoo hiện nay đều không thể crawl được nội dung của file Flash. Chính vì vậy bạn nên tránh dùng Flash để hiển thị nội dung của website. Nhất là việc sử dụng flash làm menu cũng ảnh hưởng lớn đến việc crawl của Spider. Ngoài ra nếu người truy cập không cài flash hoặc block file flash thì họ sẽ không thể truy cập đến trang khác.

Nếu bạn sử dụng file flash làm intro cho trang chủ thì nên đặt 1 đoạn mã html có nội dung click here và dẫn đến trang main.

Read Full Post | Make a Comment ( None so far )

« Previous Entries

Liked it here?
Why not try sites on the blogroll...