搜索引擎提交入口

百度网站提交:http://www.baidu.com/search/url_submit.html
百度博客(RSS)搜索:http://utility.baidu.com/blogsearch/submit.php

百度博客(RSS)你可以采取手动通知和自动通知两种方式使用ping服务:
手动ping:访问http://ping.baidu.com/ping.html页面,在输入框中输入博客(RSS)地址或者feed地址,点击“提交博客(RSS)”按钮即可。

GOOGLE网页提交:http://www.google.com/intl/zh-CN/add_url.html
GOOGLE博客(RSS)提交: BLOGSearch:http://blogsearch.google.com/ping?hl=zh-CN

有道搜索:http://tellbot.yodao.com/report?type=web

有道博客(RSS)提交:http://tellbot.yodao.com/report?type=BLOG
搜狗博客(RSS)提交:http://www.sogou.com/feedback/blogfeedback.php

搜狗网页提交:http://www.sogou.com/feedback/urlfeedback.php

腾讯SOSO博客(RSS)提交:http://blog.soso.com/join.html

腾讯SOSO网站提交:http://www.soso.com/help/usb/urlsubmit.shtml

微软bing(必应)提交:http://cn.bing.com/docs/submit.aspx

雅虎中国网站提交:http://search.help.cn.yahoo.com/h4_4.html

几大搜索引擎网页使用标准

网页的标准在不断的被炒热,HTML5的出台不仅让WEB语言有了新的标准还让FLASH和silverlight受到了不小的惊吓。最近也用HTML5写了一些网站,其实并没有像那些个做HTML5网站的人,上来就说IE系列的浏览器是用不了的。只是其中一些元素IE是不支持呢,大部分标签还是兼容的。

对于其他网站的使用情况我也发现有一部分开始使用<!doctype html>作为声明了,那么就是说,开始符合HTML5标准了,我这里只提供搜索引擎的使用情况,我找到两家搜索引擎在使用<!doctype html>,其中是有道和百度。从使用情况上看有道更好一些,百度只有首页在使用,其他页面是没有的。

有道 <!doctype html>
百度 <!doctype html>
yahoo.cn  XHTML 1.0 Transitional
搜搜 XHTML 1.0 Transitional
必应 XHTML 1.0 Transitional
搜狗  没有声明
google 没有声明

提升搜索引擎结果页面显示内容的方面的建议

1、网页的title、meta description以及URL结构很重要,对于搜索引擎了解网站的内容有帮助。

2、Title里描述性的词和短语对于搜索引擎和用户了解网页内容重点有帮助。要使用与页面主体内容相关的,并且与其他页面不重复的页面title。

4、大部分主流的搜索引擎会在搜索结果页面展示大概title里的60个字符。而且,搜索引擎对于title里超过一定长度之后的词所给的权重会很少。不要往title里添加不重要的关键词。

5、如果网站被DMOZ收录了,Google搜索结果页面会显示DMOZ里的title和描述。这不一定是好事情,很可能网站缺少了自己的title或者meta description。为了避免这个问题,网站可以使用“NOODP”这个标签。

6、网页的title设定要考虑好用户的搜索常用词。要了解自己网站目标用户的搜索习惯。

7、meta description的内容不是Google的排名影响因素(meta keywords也不是),但是在Google搜索结果里显示有实际意义的摘要对于点击率方面会有影响。要设定有趣的、能吸引用户的描述文字,不要简单的复制页面内容。要避免与其他页面的meta description重复。

8、尽量在meta description里的文字长度要满足Google搜索结果里面的两行摘要。

9、如果网站在搜索结果里面,只有title和url,没有摘要内容显示,需要检查下是否在robots.txt里做了限制或者使用了“nosnippet”标签。

10、网站可以通过这几点来提升获得sitelinks的几率

第一、使用清晰的层级URL结构

第二、内部链接使用有效的锚文本

第三、不要使用过深的层级页面

类似/dir1/dir2/dir3/dir4/dir5/dir6/page.html这样的不要。目录名与所管辖的页面要有一定的从属关系。URL里尽量要有关键词。面包屑导航会有帮助。

11、建议使用Google webmaster tools对sitelinks进行控制,排除没有意义的链接和不想要的链接。

关于URL和跳转方面的建议

1、如果同样的页面有多个URL可以访问,建议使用301跳转或者rel=”canonical”标记,否则会分散链接权重。canonical页面的URL尽量要好记,容易识别并且符合通用规则。

2、对于url中,如果不是以/结尾的,一般会认为这个url是文件,而不是目录。内部链接是要注意保持一致,不要有的有/,有的不带。

3、在设定跳转的时候,如果301更为合适,就不要使用302跳转。

4、如果存在http和https共存的情况,尽量使用跳转或者canonical标记。

关于页面优化方面的建议

1、H1、H2、H3这类heading标签对于搜索引擎了解页面内容结构有帮助。Heading标签内容尽量简明扼要的描述词汇。但是不要在页面上滥用。对于使用em或者strong更为合适的地方,使用heading标签也是不推荐的。对于同一个heading标签,字体方面的设定尽量保持一致。heading标签的目的是为了区分页面内容结构,不要为了样式而是用。

2、H1标签是最重要的heading标签,对于搜索引擎了解页面的内容重要很有帮助。

3、Logo图片链接对于搜索引擎链接网站的导航结构有用,尽量保证logo链接使用最正确的url。

4、图片的alt描述对于搜索引擎尤其是图片搜索引擎有用,alt描述文字一般被搜索引擎认为是图片链接的锚文本。

5、链接的锚文本文字要有描述性意义,不适用类似clikck here或者learn more这类词作为锚文本。锚文本应该要简洁、描述性,避免长语句作为锚文本。

搜索引擎的分析

  众所周知搜索引擎的算法是不断变化的,所以要不断的去观察去学习,在这个过程中不断的去进步,然后要有自己的思想,有自己的方法去试探搜索引擎的改变和规律。这里我想写出几点和网上相违背的观点,是我观察中得来,其实我建议做博客的SEO们去建立一个SEO实验室的分类,用自己的博客去试验,这样才是真正的掌握最新的信息。

网上一直盛传PR停止更新,将要取消PR这个信息我是一个不相信的,并且在我新做的一个网站中,PR已经得到更新,是一个行业站,PR第一次更新已经变成2。

关于robots的语法上Allow的语法,网上一直说是不支持的,或者说只有google支持,我最近在百度有啊上发现他的robots是有写Allow的,并且是对自己和google使用ALLOW标记。我想这个是一个启示,百度也是支持ALLow的。

关于wordpress对于评论的rel=‘external nofollow’使用很多人是说这个是只有google不会抓取的,百度是不认的,但是我另外一个博客通过一个月的时候,通过评论的手段外链由0到1000多(雅虎外链查看的),但是百度是一个也没有显示出来的,这说明百度对这个语句也是认可的,起码说现在已经认可了。

其实每个人都承认搜索引擎在不断的改变,可是这些细节改变了,大多数人还是看以前的文章,用以前的思路,网络上的群体是无意识的,所以有了“贾君鹏”事件,难道作为高一级的站长也一样这样的跟风吗?

网站被搜索引擎惩罚的主要原因

我认为以下是致使搜索引擎惩罚网站的原因:
–>内容重复
–>连向作弊的网站 
–>站内的绝大部分网页有相同的网页title
–>加入到Link Farm或者Link交换类网站
–>使用被惩罚过的域名
–>网站建立在被惩罚的IP上
–>关键词堆积
–>所有的锚文字都相同
–>使用CSS或背景色隐藏内容,十恶不赦
–>使用JavaScript跳转
–>相同ip之下的网页直接进行大量交换链接
–>桥页和Cloaking,诱导搜索引擎的爬虫
–>成人内容,违禁药品,赌博相关内容
–>和作弊的网站在同一服务器上
–>用Javascript制作的网站导航条或目录
–>单一图片和Flash的网站

如果您想做一个优质的网站,我建议几点:
1、不要欺骗用户,或提交给搜索引擎一种内容,而显示给用户另一种。
2、首先站点应该是面向用户的,而不是面向搜索引擎的。
3、有独特内容的网页,而不是简单抄袭和重复互联网上已有内容的网页。
4、经常有新内容产生的站点

搜索引擎优化(SEO)专业术语

Link Popularity 网站的链接广泛度

  在搜索引擎排名中的作用已得到广泛的认同和重视。实际上,即使你没有在GOOGLE上提交你的站点,但与其它网站作了链接,GOOGLE也可能收录你的网站。搜索引擎还可能完全依据你的链接广泛度决定你的网站排名。

  Internal Links 内部链接

  本网站内部网页之间的链接。

  External Links外部链接:

  本网站外部的链接,一般是指其他网站连到本网站的链接。

  Backward Links或Incoming/Inbound Links反向/导入链接:

  意义与“外部链接”接近,指其他网站连到本网站的链接。

  Outgoing/Outbound Links导出链接:

  指从本网站连到其他网站的链接。

  PageRank (简称PR)

  PageRank是Google衡量网页重要性的工具,测量值范围为从1至10分别表示某网页的重要性。在Google工具栏可以随时获得某网页的PageRank值。

  Search Engine Optimization (简称SEO) 搜索引擎优化:

  Search Engine Positioning 搜索引擎定位:

  Search Engine Ranking 搜索引擎排名:

  External files外部文件存储:

  把javascript文件和css文件分别放在js和css外部文件中。这样做的好处是把重要的页面内容放到页面顶部,同时能缩小文件大小。有利于搜索引擎快速准确地抓取页面重要内容。

  Keyword Density 关键词密度:

  ROBOTS 搜索机器人:

  Affiliate Marketing 联属网络营销(有的称会员制营销、网站联盟等):

  联属网络营销 指的是一种网站A为网站B放置广告按钮,然后从为网站B带来的销售额中获得回佣的一种广告系统。某些广告主通过这种方式获得市场信息而不是现金销售。这种方式被营销费用比较紧张的新网站采用得比较普遍。

  Cost-Per-Click (简称CPC)按点击数付费:

  联属网络营销管理系统记录每个客人在联属会员网站上点击到商家网站的文字的或者图片的链接(或者Email链接)次数,商家(Merchant)按每个点击多少钱的方式支付广告费。

  Cost-Per-Lead (简称CPL)或Cost-Per-Acquisition (简称CPA)按引导数付费或:

  访问者通过联属会员的链接进入商家网站后,如果填写并提交了某个表单,管理系统就会产生一个对应给这个联属会员的引导(Lead)记录,商家按引导记录数给会员付费。

  Cost-Per-Sale (简称CPS) 按销售额付费:

  商家只在联属会员的链接介绍的客人在商家网站上产生了实际的购买行为后(大多数是在线支付)才给联属会员付费,一般是设定一个佣金比例(销售额的10%到50%不等)。

  Pay For Performance (按效果付费):

  联属营销按效果付费的营销方式无论对于商家还是联属会员都是比较容易接受的。由于网站的自动化流程越来越完善,在线支付系统也越来越成熟,越来越多的联属网络营销系统采用按销售额付费的方法。由于这种方法对商家来说是一种零风险的广告分销方式,商家也愿意设定比较高的佣金比例,这样就使得这种方式的营销系统被越来越多地采用。

  Open Directory Project (简称ODP) 目录索引:

  Full Text Search Engine 全文搜索引擎:

  Search Index/Directory 目录索引类搜索引擎:

  META Search Engine 元搜索引擎:

  Spider 俗称“蜘蛛”:

  Indexer 检索程序:

  Free For All Links (简称FFA)免费链接列表:

  Stop Words/Filter Words 停用词/过滤词:

  这两者意义一样,都是指一些太常用以至没有任何检索价值的单词,搜索引擎碰到这些词时一般都会过滤掉。因此为节省空间,应尽量避免使用这一类的词,尤其是在对文字数量有严格限制的地方。

  Spam:

  Frame Sets 框架结构:

  有些搜索引擎(如FAST)是不支持框架结构的,他们的“蜘蛛”程序无法阅读这样的网页。

  Image Maps 图象区块:

  当“蜘蛛”程序遇到这种结构时,往往会感到茫然不知所措。因此尽量不要设置Image Map链接。

  Dynamic Pages 动态网页:

  通过程序和数据库连接制作的网页,任何地址中带“?”号、“&”号(及其他类似符号)的网页都会把“蜘蛛”程序挡在门外。

  Invisable/hidden text 隐藏文本内容:

  意欲在不影响网站美观的前提下通过包含大量关键词的网页提高关键词相关性得分,从而达到改善搜索引擎排名的目的。

  Invisable/hidden links 隐藏链接:

  意欲在不影响网站美观的前提下通过在其它页面添加指向目标优化页的隐形链接,通过提升链接得分而改善搜索引擎排名。

  Misleading Words 误导性关键词:

  在页面中使用与该网页毫不相干的误导性关键词来吸引查询该主题的访问者访问网站。这种做法严重影响了搜索引擎所提供结果的相关性和客观性,为搜索引擎所深恶痛绝。

  Repeated Words 重复性关键词:

  这种作弊技术也被称为“关键词堆砌欺骗(Keyword Stuffing)”,它利用搜索引擎对网页正文和标题中出现的关键词的高度关注来对关键词进行不合理的(过度)重复。类似的其它做法还包括在HTML元标识中大量堆砌关键字或使用多个关键字元标识来提高关键词的相关性。这种技术很容易被搜索引擎察觉并受到相应惩罚。

  Keyword Stuffing 关键词堆砌:

  Cloaked Page 隐形页面:

  对实际访问者或搜索引擎任一方隐藏真实网站内容,以向搜索引擎提供非真实的搜索引擎友好的内容提升排名。

  Deceptive redirects 欺骗性重定向:

  指把用户访问的第一个页面(着陆页)迅速重定向至一个内容完全不同的页面。

  Shadow Domain 鬼域:

  这是最常见的欺骗性重定向技术,通过欺骗性重定向使用户访问另外一个网站或页面。

  Meta Refresh刷新标识:

  Doorway Page 门页:

  也叫“Bridge/Portal/Jump/Entry Page”。是为某些关键字特别制作的页面,专为搜索引擎设计,目的是提高特定关键词在搜索引擎中的排名所设计的富含目标关键词的域名,且重定向至另一域名的真实网站。搜索引擎的Spiders往往忽略对那些自动重定向到其它页的页面的检索。

  Mirror Sites 镜象站点:

  通过复制网站或卬页的内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引。现在大多数搜索引擎都提供有能够检测镜象站点的适当的过滤系统,一旦发觉镜象站点,则源站点和镜象站点都会被从索引数据库中删除。

  Link Spamming 作弊链接/恶意链接:

  link farms 链接工厂:

  Bulk Link Exchange Programs大宗链接交换程序:

  Cross Link 交叉链接:

  Doorway Domain 门域:

  专为提高特定关键词在搜索引擎中的排名所设计的富含目标关键词的域名,然后重定向至其它域名的主页。由于搜索引擎一般忽略自动重定向至其它页的页面的检索,所以不提倡使用这种技术。

  Crawlers 网络爬虫:

  Meta Title 标题标记:

  Meta Description 描述标记:

  Meta Keywords 关键字标记:

  Meta Tags 原标记:

  Frameset Tag 框架集标记:

  Traffic rank 网站流量排名:

  Reach per million users 每百万用户访问网站人次:

  Reach rank 网站访问人次排名:

  Page Views per user 网页平均访问量:

  Page Views rank 网页访问量排名:

  Users Reach 访问用户数:

  Page Views 页面浏览数:

搜索引擎排序技术

随着“眼球经济”席卷互联网,成千上万的资金迅速流向最能吸引浏览着眼球的搜索引擎市场。有大量调查显示搜索引擎市场正处在高速发展时期,成为了未来几年内最具发展潜力的产业之一。随着Google、百度、中国搜索等各具特色的搜索引擎逐渐成为人们最常用的网络工具,企业对搜索引擎的注意力也从“观察”升级为“动武”。

随着市场容量和使用者人数的不断激增,如何完善搜索功能使之更加公平、公开、标准和人性化也就随之成为了一个备受关注的话题。但是有一个矛盾体在这其中不断的显现出来:收费可以为搜索引擎公司带来利润,但同时会降低访问者的体验满意度。如何权衡金钱和用户需求之间的天平呢?

Google成功的秘密

到2004年为止,Google 已经连续两年被评为全球第一品牌,Google成立仅五年时间,最初只是两个斯坦福大学学生的研究项目。这不能不说是一个奇迹,就像比尔?盖茨创制奇迹一样。比尔?盖茨能创造奇迹,是因为他看准了个人计算机软件市场的趋势,所以创建的公司叫Microsoft(微软):Micro(小)Soft(软件)。 那么Google呢?在Google出来之前已经有一些很有成就的搜索引擎公司,其实力也很强,看来不只是Google看见了搜索的趋势.Google究竟成功的秘密在哪儿?

Google的成功有许多因素,最重要的是Google对搜索结果的排序比其它搜索引擎都要好.Google保证让绝大部分用搜索的人,都能在搜索结果的第一页找到他想要的结果。客户得到了满足,下一次还过来,而且会向其他人介绍,这一来一往,使用的人就多了。所以Google在没有做任何广告的前提下,让自己成为了全球最大的品牌.Google究竟采用了哪种排序技术?PageRank,即网页级别。

Google有一个创始人叫Larry Page,据说PageRank的专利是他申请的,于是依据他的名字就有了Page Rank.国内也有一家很成功的搜索引擎公司,叫百度。百度的创始人李彦宏说,早在1996年他就申请了名为超链分析的专利,PageRank的原理和超链分析的原理是一样的,而且PageRank目前还在Paten-pending(专利申请中)。言下之意是这里面存在专利所有权的问题。这里不讨论专利所有权,只是从中可看出,成功搜索引擎的排序技术,就其原理上来说都差不多,那就是链接分析。超链分析和PageRank都属于链接分析。

链接分析到底为何物?由于李彦宏的超链分析没有具体的介绍,笔者唯一看过的就是在美国专利局网站上关于李彦宏的专利介绍.PageRank的介绍倒是不少,而且目前Google毕竟是全球最大的搜索引擎,这里以PageRank为代表,详细介绍链接分析的原理。

PageRank揭密

PageRank的原理类似于科技论文中的引用机制:谁的论文被引用次数多,谁就是权威。说的更白话一点:张三在谈话中提到了张曼玉,李四在谈话中也提到张曼玉,王五在谈话中还提到张曼玉,这就说明张曼玉一定是很有名的人。在互联网上,链接就相当于“引用”,在B网页中链接了A,相当于B在谈话时提到了A,如果在C、D、E、F中都链接了A,那么说明A网页是最重要的,A网页的PageRank值也就最高。

如何计算PageRank值有一个简单的公式:

其中:系数为一个大于0,小于1的数。一般设置为0.85.网页1、网页2至网页N表示所有链接指向A的网页。

由以上公式可以看出三点:

1、链接指向A的网页越多,A的级别越高。即A的级别和指向A的网页个数成正比,在公式中表示,N越大, A的级别越高;

2、链接指向A的网页,其网页级别越高, A的级别也越高。即A的级别和指向A的网页自己的网页级别成正比,在公式中表示,网页N级别越高, A的级别也越高;

3、链接指向A的网页,其链出的个数越多,A的级别越低。即A的级别和指向A的网页自己的网页链出个数成反比,在公式中现实,网页N链出个数越多,A的级别越低。

每个网页有一个PageRank值,这样形成一个巨大的方程组,对这个方程组求解,就能得到每个网页的PageRank值。互联网上有上百亿个网页,那么这个方程组就有上百亿个未知数,这个方程虽然是有解,但计算毕竟太复杂了,不可能把这所有的页面放在一起去求解的。对具体的计算方法有兴趣的朋友可以去参考一些数值计算方面的书。

总之,PageRank有效地利用了互联网所拥有的庞大链接构造的特性。 从网页A导向网页B的链接,用Google创始人的话讲,是页面A对页面B的支持投票,Google根据这个投票数来判断页面的重要性,但Google除了看投票数(链接数)以外,对投票者(链接的页面)也进行分析。「重要性」高的页面所投的票的评价会更高,因为接受这个投票页面会被理解为「重要的物品」。从新浪、雅虎、微软的首页都有我网页的三个链接的话,可能比我在其他网站找三十个链接还强。如果还有人不理解这个原理,就去想想有句成语叫:三人成虎。如果有三个人都说北京大街上有老虎,那么许多人会认为有老虎,如果这三个人都是国家领导人的话,那么所有人都会认为北京大街上有老虎。

每个网页都会有PageRank值,如果大家想知道自己网站的网页PageRank值是多少,最简单的办法就是下载一个Google的免费工具栏

每当你打开一个网页,都可以很清楚的看见此网页的PageRank值。当然这个值是一个大概数字。

据Google技术负责人介绍,Google除了用PageRank衡量网页的重要程度以外,还有其它上百种因素来参与排序。其它搜索引擎也是如此,不可能按照某一种规则来进行搜索结果的排序。

其他方法

HillTop算法:

HillTop同样是一项搜索引擎结果排序的专利,是Google的一个工程师Bharat在2001年获得的专利.Google的排序规则经常在变化,但变化最大的一次也就是基于HillTop算法进行了优化.HillTop究竟原理如何,值得Google如此青睐?

其实HillTop算法的指导思想和PageRank的是一致的,都是通过网页被链接的数量和质量来确定搜索结果的排序权重。但HillTop 认为只计算来自具有相同主题的相关文档链接对于搜索者的价值会更大:即主题相关网页之间的链接对于权重计算的贡献比主题不相关的链接价值要更高。如果网站是介绍“服装”的,有10个链接都是从“服装”相关的网站链接过来,那这10个链接比另外10个从“电器”相关网站链接过来的贡献要大.Bharat称这种对主题有影响的文档为“专家”文档,从这些专家文档页面到目标文档的链接决定了被链接网页“权重得分”的主要部分。

与PageRank结合HillTop算法确定网页与搜索关键词的匹配程度的基本排序过程取代了过份依靠PageRank的值去寻找那些权威页面的方法。这对于两个具有同样主题而且PR相近的网页排序过程中,HillTop算法就显得非常的重要了.HillTop同时也避免了许多想通过增加许多无效链接来提高网页PageRank值的做弊方法。

锚文本(Anchor Text)

锚文本名字听起来难以理解,实际上锚文本就是链接文本。例如,在个人网站上把中央电视台做为新闻频道的链接,访问者通过点击网站上的“新闻频道”就能进入央视网站,那么“新闻频道”就是中央电视台网站首页的锚文本。

锚文本可以做为锚文本所在的页面的内容的评估。正常来讲,页面中增加的链接都会和页面本身的内容有一定的关系。服装的行业网站上会增加一些同行网站的链接或者一些做服装的知名企业的链接;另一方面,锚文本能做为对所指向页面的评估。锚文本能精确的描述所指向页面的内容,个人网站上增加 Google的链接,锚文本为“搜索引擎”。这样通过锚文本本身就能知道,Google是搜索引擎。

锚文本对搜索引擎起的作用还表现为可以收集一些搜索引擎不能索引的文件。例如,网站上增加了一张张曼玉的照片,格式为jpg文件,搜索引擎目前很难索引(一般只处理文本)。若这张照片链接的锚文本为“张曼玉的照片”,那么搜索引擎就能识别这张图片是张曼玉的照片,以后访问者搜索“张曼玉”的时候,这张图片就能被搜索到。

由此可见,在网页设计中选择合适的锚文本,会让所在网页和所指向网页的重要程度有所提升。

页面版式

每个网页都有版式,包括标题、字体、标签等等。搜索引擎也会利用这些版式来识别搜索词与页面内容的相关程度。以静态的html格式的网页为例, 搜索引擎通过网络蜘蛛把网页抓取下来后,需要提取里面的正文内容,过滤其他html代码。在提取内容的时候,搜索引擎就可以记录所有版式信息,包括:哪些词是在标题中出现,哪些词是在正文中出现,哪些词的字体比其他的字体大,哪些词是加粗过,哪些词是用KeyWord标识过的等等。这样在搜索结果中就可以根据这些信息来确定所搜索的结果和搜索词的相关程度。例如搜索“毛泽东”,假如有两个结果,一篇文章标题是《毛泽东的一生》,另一篇文章的标题是《江青的一生》但内容有提到毛泽东,这时搜索引擎会认为前者比较重要,因为“毛泽东”在标题里出现了。

因此,合理的利用网页的页面版式,会提升网页在搜索结果页的排序位置。

收费排名

应该说收费排名并不属于排序技术(这里指的收费排名也包括竞价排名),而是一种搜索引擎的赢利模式。但收费排名已经最直接的影响到了搜索引擎的排序,在此也略做说明。

用户可以购买某个关键词的排名,只要向搜索引擎公司交纳一定的费用,就可以让用户的网站排在搜索结果的前几位,按照不同关键词、不同位置、时间长短来定义价格。价格从几千元到几十万元不等(像“六合彩”在3721上的排名费用大多是几十万)。

收费排名一方面给搜索引擎公司带来收益,一方面给企业带来访问量,另外对访问者也有一定好处。因为访问者想找“西服”,企业想卖“西服”,于是出钱让访问者能找到他,这样,买家和卖家能马上见面。但收费排名给访问者带来更多的却是不真实,结果排序已经失去了公正性,有时候还带来大量垃圾。在百度搜索引擎上搜索“星球”,排在第一位的是一家做石墨的公司,排在第二位的居然是“想找星球?上易趣吧!”(见下图)。真有些让访问者哭笑不得。

当然,对于企业来说,收费排名是提升网站在搜索引擎中排名的最直接和最简单的办法。如今,如何提升网页在搜索引擎中的排序,已经形成了一门职业,叫SEO(Search Engine Optimization),即搜索引擎优化.SEO是针对搜索引擎排序的技术,通过修改网页(或者网站)结构和主动增加网站链接等方法来让搜索引擎认为这些网页是很重要的,从而提升网页在搜索引擎结果中的排序。

排序技术的发展趋势

各种搜索引擎的技术改进和优化,都直接反应到搜索结果的排序上。许多搜索引擎都在进一步研究新的排序方法,来提升客户的满意度。专业人士认为, 目前的搜索引擎排序算法上还存在两大不足一、没有真正解决相关性。相关性是指搜索词和页面的相关程度。仅仅通过链接、字体、位置等表面特征,不能真正判断搜索词和文章的相关性,更何况许多时候这些特征不会都同时存在。这也是许多对搜索引擎做弊方法能有效的原因。另外,有些文章中没有出现搜索词,但说的就是和搜索词十分相关的内容,例如搜索“恐怖分子”,但有网页是介绍本拉登的一些破坏行动,文中没有出现“恐怖分子”的子眼,搜索引擎就无法搜索到该网页。表面特征只能治标,不能治本。治本的方法应该是增加语意理解,例如主题词和关键词的提取,从语意上分析,得出搜索词和网页的相关程度,分析的越准,效果就会越好。

二、搜索结果的单一化。在搜索引擎上,任何人搜索同一个词的结果都是一样。这样明显不能满足访问者。科学家搜索“星球”,可能是希望了解星球的知识,但普通人可能是想找“星球大战”电影,但搜索引擎所给的都是一样的结果。如何满足这些不同类型的访问者,需要对搜索结果的个性化。国外 vivisimo公司就是想解决这个问题,他们采用对搜索结果自动聚类的办法来满足不同类型客户的需要。搜索结果排序如果要实现从单一化到个性化,vivisimo已经迈出了一步,但最理想的结果应该是针对每个访问者,排序结果直接和他们的搜索习惯和意愿有关。搜索“体育”,对喜欢足球的人应该把足球的相关结果排在前面,对喜欢篮球的人应该把篮球的相关结果排在前面。

搜索引擎的排序技术应该也会朝着解决这两个不足的方向发展:语意相关性和排序个性化。前者需要完善的自然语言处理技术,后者需要记录庞大访问者信息和复杂的计算,要达到其中任何一个的要求均非易事,如何解决这些难题,任务落在了科学家和工程师们的肩上,哪个搜索引擎解决了这些问题,她可能会称为下一个搜索世界的霸主。

QQ空间被搜索引擎收录

   或许这是很早就开始的事情,但是我最近才注意到,在搜索一些东西的时候,QQ博客竟然能够获得很高的排名,想想之前百度对QQ空间是根本不感冒的,如今QQ空间已经做的相当不错了,在搜索一个关键词的时候我发现了一个QQ空间,里面回帖的评论都是成百上千的,从此我感到有点惊讶,为何有如此的关注度,是因为这个关键词还是因为QQ博客首页推荐或者其他的手段,要知道如此活跃的博客即使是广告费用,每天就可能达到上万元了吧,真希望自己的站有一天也能那样。