Categories

A sample text widget

Etiam pulvinar consectetur dolor sed malesuada. Ut convallis euismod dolor nec pretium. Nunc ut tristique massa.

Nam sodales mi vitae dolor ullamcorper et vulputate enim accumsan. Morbi orci magna, tincidunt vitae molestie nec, molestie at mi. Nulla nulla lorem, suscipit in posuere in, interdum non magna.

Google和百度对中文URL的ANSI编码识别。

我们可以看到,现在百度已经可以辨认出ANSI编码的中文URL,并且可以将其还原为汉字显示在搜索结果的下面。而GOOGLE不对ANSI编码还原,你网站是什么编码,它就索引什么编码,但是如果你的URL是中文,未进行编码的,GOOGLE会用UTF-8对其进行编码,这样就会出现两钟URL,一种是纯文字,一种是经过编码过的URL。

所以,我们现在做网站,在URL方面,可以不用考虑用中文URL,经过多方面的观察,ANSI编码在Java,PHP程序中使用和转载过程中,不容易出错,就是用了象Dreamweaver类的网页编辑器,URL也不容易被改变。

那么,既然ANSI编码这么好,我们就可以放心使用了吗?稍等下,我们还要做一个观察,目前GOOGLE虽然可以知道AISI编码的URL是什么,但是不会还原成中文出现在搜索结果里,也就是说,ANSI编码里面,如果含有小写字母和大写字母并存的情况,那么GOOGLE会不会认为是不同的URL?百度可以还原成中文,那么ANSI编码大小写是都可以还原成中文的,百度是否认为是同一个URL呢?

举个例子:“加飞”的ANSI编码为:%BC%D3%B7%C9 ,也可以为:%bc%d3%b7%c9

这个问题先问到这里,过几天再来回答(见下面评论部分)。

2 comments to Google和百度对中文URL的ANSI编码识别。

  • 加飞

    经过观察,Google不能将ANSI码转换为汉字,百度可以。
    但是百度对301转向很不敏感,也就是说,缓存里的旧URL和转向的新URL没有必然联系,但是百度可以通过301来更新缓存内容,URL不变。新的URL需要从页面重新开始收录。
    也就是说,旧的URL通过301转向的URL不能被百度收录,所以在我们改变域名,或者更换网站目录时,如果某些页面的URL发生变化,在我们使用301转向的同时,也要保证新的URL在页面里有足够的链接供百度爬行收录。

  • [...] 这个例子里面,要把http://localhost/(jarfee).html用301转向到http://localhost/jarfee-sbg-case.html ,语法都是正确的,但是有可能会不能正常工作,我想,是不是要把全角的()转换成ANSI编码(%A3%A8%A3%A9)呢?然后试了下: [...]

Leave a Reply

  

  

  

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>