搜索引擎优化(SEO)从入门到精通
(刘志军 2008-4)
<适合群体>
本书适合作为SEO 的入门及提高的普及型阅读材料。
<编者信息>
刘志军 网络高级开发工程师,具有多年搜索引擎开发、搜索引擎优化经验,对网站技术优化有独到
的见解,并开发多款搜索引擎优化工具。个人网站:非常代码网(
supercss.com... ),天天收藏夹
(
ttscj.com... )。
<参考网站>
本文部分内容参考
dunsh.org...、www.seotest.cn 、www.seofans.cn 、www.chinaseo.org.cn 、
wm23.com... ,www.tomx.com ,www.seo9.org ,seo.highdiy.com 及胡宝介《搜索引擎优化(SEO)
知识完全手册》。
<免责声明>
本电子书为免费发布,所述内容为作者多年经验积累及转载他人博客内容,不保证在任何情况下都
有效及正确,仅供参考,对于接受并信赖此内容所发生的风险都应自行承担。
<版权声明>
本电子书供专业人员个人研究参考,刘志军为惟一版权拥有者,并未授权任何单位或个人对本研究
报告进行编辑、出版、发行,转载请注明出处,否则视为侵权。
第一部分 正确认识搜索引擎优化
成为SEOER应该具有的素质
第二部分 域名对SEO的影响
域名及网站名称
域名及网站名称中的关键词
域名后缀
过期域名
域名注册
二级域名
第三部分 主机对SEO的影响
虚拟主机
服务器托管
虚拟专用服务器(VPS)
国外主机
主机转移
稳定支持
第四部分 搜索引擎优化的核心:关键词策略12
关键词选择
关键词密度
关键词分布
第五部分 对搜索引擎友好的网页设计
Title 和 Meta 标签
访问结构
目录和文件命名
动态网页静态化
框架结构
图像优化
FLASH 优化
表格使用
网页减肥
不同位置的网页优化
Robots.txt
网页相似度
404 页面
内容优化
第六部分 搜索引擎优化的重点:链接策略
导入链接
导出链接
内部链接
关键词链接文本及上下文语意
链接的重要性
第七部分 搜索引擎优化作弊
SEO 作弊手段
搜索引擎对作弊的处罚
第八部分 Google 搜索引擎
Google PageRank
Google Dance
Google SandBox
Google 网页搜索
Google Adsense
Google Adwords
Google 趋势
Google Sitemap
第九部分 百度搜索引擎
百度网页
百度新闻
百度贴吧、百度知道、百度空间、百度百科
百度图片
百度中文搜索风云榜
百度指数
百度相关搜索
百度竞价
百度的人工干预
第十部分「网络销售员」网络营销服务启动
「网络销售员」网络营销服务是什么?
「网络销售员」网络营销服务和通常的建站程序有什么不同?
参加「网络销售员」服务需要经过哪些步骤?
服务费是多少?
第十一部分 SEO工具介绍
SeoQuake (FireFox)
SearchStatus (FireFox)
DOM 查看器(FireFox)
User Agent Switcher(FireFox)
地图和全站扫瞄分析工具 XENU
关键字排名查询工具
注册助手
关键词难度工具
正则表达式测试工具
登录奇兵
HttpWatch
网站流量统计
使用ZBLog 搭建网站
在线SEO工具
第十二部分 网站SEO分析案
当当网站分析报告
走进中关村网分析报告
第十三部分 搜索引擎优化盈利模式
为别人优化网站
优化网站获得流量获取广告收入
优化网站获得商业客户
第十四部分 搜索引擎优化 (FAQ)
如何获得域名对应的IP呢?
怎样查自己网站的反向链接?
什么是网站深度链接比值?
搜索引擎爬行的规律是什么呢?
<span style=font-weight : bolder;>关键词</span> 作用是否和<strong>一样呢?
如何判断关键词的优化难度?
如何让搜索引擎收录网站?
如何使用博客进行排名呢?
页面收录减少,如何检查判断?
区别蜘蛛代码(ASP)
如何进行关键词定价?
如何提高关键词密度?
如何降低网页相似度?
什么是Google炸弹
如何提交DMOZ?
如何查看IIS日志?
哪些词在百度里面是做不上去的呢?
如何进行友情链接?
关于恶意软件警告:「该网站可能含有恶意软件,有可能会危害您的电脑。」
第十五部分 在线资料
搜索引擎发布的官方权威资料
搜索引擎优化论坛、博客
第十六部分 与刘志军一起讨论搜索引擎优化
获取最新教程
QQ群在线答疑
在线视频培训
高性价比试验虚拟主机
前言
搜索引擎优化(SEO:Search Engine Optimazation)在当前网络推广具有举足轻重的作用,倍受广大
站长的重视。但目前网络上的资料比较分散,而且很多理论性强,而没有具体操作步骤,使SEO 学
习者不能付诸实施。
本书作者具有5 年网站开发经验、2 年搜索引擎开发经验、拥有多个个人开发的网站,在优化自己
的网站同时积累了大量的经验,为帮助国内SEO 学习者更快进步,特利用业余时间结合国内外SEO
研究者的精华思想,以及自己多年实践经验编写此书,并以电子版形式供广大网络营销人士免费下
载学习、共同交流发展。
本书适合作为 SEO 的入门及提高的辅导阅读材料。需要指出的是,由于各大搜索引擎在排名算法
上「以搜索用户为中心」的指导思想是一致的,所以在具体算法上虽然各有侧重的指标,但一般大
同小异。电子书《搜索引擎优化(SEO)从入门到精通》并非为传授排名排名秘笈),但我相信,如果
您通过本书中介绍的相关内容理解了搜索引擎优化的真正含义和操作方法,利用规范的方法改善网
站在搜索结果中的排名同样是有效的。
本文内容主要参考网站,特对以下网站及站长表示感谢!
点石互动:www.dunsh.org
SEO实验室:www.seotest.cn
SEO资料站:www.chinaseo.org.cn
刘志军 2007-6-21 于北京
第一部分 正确认识搜索引擎优化
搜索引擎优化(SEO)是网站采用对搜索引擎友好的技术手段,达到网站在搜索引擎中排名靠前及收录
数量增加。搜索引擎优化工作贯穿网 站策划、建设、维护全过程的每个细节,值得网站设计、开发
和推广的每个参与人员了解其 职责对于 SEO 效果的意义。
优化好的网站,从搜索引擎来的流量将会有很大的提高,不过这仅仅是能带来用户,而真正能够留
住用户的是网站的内容。所以搜索引擎优化仅仅辅助手段,在网站建设的过程中仍然要将大部分精
力放着网站内容的完善上。
由于优化目的是在搜索引擎上获的好的排名,而搜索引擎不属于我们,排名的影响因素有很多,所
以对优化的效果就不可能有100%的把握,我们能做的是就是在已知的因素上下功夫,做到齐头并进,
这样不论搜索引擎算法如何改变,都不会使排名有特别大的波动。
成为SEOER 应该具有的素质
1 信心
SEO 是网络营销的重要方法,我们将学到SEO 所需要的各种技术,这些技术都是经过实践考研的。
不要因为一时优化没有上去而放弃,要对SEO 技术和自己的能力有信心。
2 耐心
做SEO 是一个长期的繁杂的过程,周期可能是几个月,所以一定要有耐心 ,并坚持做下去。
举个例子:我曾经做了一个垃圾站,提交给百度很久了,就是不见收录,我有点灰心了,就不再
关心这个网站了。过了几个月,偶然想起这个网站,再看看,收录的非常好。
3 细心
SEO 涉及到网站内外的方方面面,因素很多,在遇到问题的时候,要仔细根据现象将全部的可能
都要想到,针对每个进行深入分析,这样才能解决问题。
举个例子:我做的另外一个网站,百度收录了一段时间后就不再收录了,我找了很多地方都没有
发现问题,某日在查看网站代码的时候发现,因为一个标记设置的特别小,导致新的数据显示不出
来,将这个值改大后,收录又正常了。
4 虚心
SEO是一个变化很快的技术,你刚刚学到的可能几个月以后就失效了;同时还可能有更多更好的
技术出现,所以要经常向同行学习。例如:点石论坛
第二部分 域名对SEO 的影响
域名是网站的基础,一个好的域名对于网站的意义是不言而喻的。
域名及网站名称
域名,是人们进入互联网时对其相应网站的第一印象。如果别人看到您的域名就会联想到这是一个
什么样的网站、突出的主题、所在的行业和地区;第一步便是成功的。如果该域名更具有简洁、明
了、好记、含义深刻的特点,可以肯定这必是一个好的域名。
好的域名及网站标准:
1.通过域名就可以想起网站名称,记得网站名称就可以输入域名。
比较好的例子:百度
baidu.com... , 域名就是中文名称的拼音,非常容易记忆,而且输入也
非常方便。
比较差的例子:帖易
teein.com... , 域名是英文的组合,我知道这个网站有一年多了,每次
都输错,不得不在百度里面查询。
2.字符不要太长,最好在6 个以内,这样比较容易记忆。
3.域名中的字符最好少出现远离键盘中心的字母,比如:z、x 等。这样用户输入起来比较方便。
比较好的例子:google
google.com... ,输入快速。
比较差的例子:中搜
zhongsou.com... ,输入起来比较费劲。
4.域名中的字符最好少出现多音节的字母,比如:w、x 等。当你向别人介绍你的域名的时候,读起
来会很拗口。
域名查询:中国万网
http://www....cn/域名及网站名称中的关键词
域名中的关键词虽然为网站排名加分影响不是很大,但有条件的最好在域名中能够出现关键词。如
果是英文,多个关键词之间要使用短横线「-」来分隔,不要使用下划线「_」。短横线隔开后的关键
词组还可以获得更多的词组搜索结果,如www.madeinchina.com 被认为只有一个词 madeinchina,
而 made-in-china 则被看作正常的made in China 词组。
网站名称中出现关键词对排名影响很大,而且关键词出现的越靠前,作用越大。通常首页的标题就
是网站的名称,在进行友情链接时就相当于为你的核心关键词作了外部链接。
比较好的例子:手机之家
imobile.com.cn... ,网站核心关键词:手机。
Seo协会
seo.org.cn... ,网站域名及名称最前面都是核心关键词SEO。
域名后缀
域名后缀有很多,通常是.com,.com.cn,.cn,.org,.net 等。
有一种观点认为:在同等情况下,代表非商业性网站 的后缀.org 和.net 有着比.com 更高的排名优
势;对中文网站来说,表示中国域的.cn 和.com.cn 又比无地区性的.com 有一定优势。
从用户角度来看:用户记住一个域名,通常是主域名,后缀默认的认为是.com,所以不论注册了多
少个后缀,一点切记要把.com 后缀注册上,避免流量丢失。
反面的例子:胜龙科技
shenglong.com.cn... 是做证券分析业务的网站。而后缀为.com的域名
shenglong.com...没有注册而被别人抢注,不仅对公司形象有一定的影响,如果被竞
争对手获得,那将严重影响你的业务。
过期域名
也许你曾经有这样的困惑,刚刚申请的域名,做好的网站,可搜索引擎就是不收录,这是什么原因
呢?这是因为这个域名以前被人使用过,由于作弊被搜索引擎删除,所以放弃续费导致域名过期,
结果被你重新注册。
域名过期是指域名到期后仍未续费,注册机构将域名暂停、DNS 也停止解析、网站无法无法访问的
状况。具体情况如下:
1.国际域名到期后仍未办理续费,域名暂停、DNS 停止解析、网站无法访问,对其进行续费后,
经过1-2 个工作日,可恢复解析。
2.国内域名到期后仍未办理续费,cnnic 会将您的域名暂停、DNS 停止解析,网站无法访问,对
其进行续费后,经过2-3 个工作日,可恢复解析。
3.域名失效:国际域名到期后,30 天内未办理续费,域名将失效。国内域名到期后,15 天内未
办理续费,域名将失效。
利用过期域名进行优化:
过期域名并不都是因为作弊而放弃续费的,里面有很多因为网站的工作人员疏忽或者网站倒闭导致
域名没有及时续费。重新找回丢失的域名将会花费很大成本和精力。所以要及时为自己的域名续费。
实例:
jeep.cn... 原属北京吉普汽车有限公司 ,后因过期被深圳市百酷科技有限公司抢注。
FM365.com... 属联想集团,后被265.com 站长蔡文胜抢注成功。
某些过期域名具有很高价值:
比如:某网站由于经营不善导致关门,域名自然没有人续费面临过期,而在网站推广的过程中
建立的大量的外部链接,在搜索引擎中收录的页面很多,PR 值很高,此域名具有很大的价值,
如果此域名业务和你的业务相同,那你在搜索引擎推广方面已经事半功倍了。
如果不小心注册了被搜索引擎屏蔽的域名请参见:搜索引擎对作弊的处罚中重新申请加入的内容。
过期域名查询工具:易名中国
http://www.ename.cn...ind.jsp域名注册
域名注册后,此域名才能真正的属于你!
域名注册步骤:
1. 查询此域名是否可以注册?
中国万网
http://www....cn/2. 在搜索引擎里查询此域名是否使用过?
方法:以
ttscj.com... 为例
百度搜索 domain:
ttscj.com...http://www.baidu.com/s?wd=dom...scj.com&cl=3Google搜索
ttscj.com...http://www.google.com/search?hl=zh-CN&newwindow=1&q=www.ttscj.com&lr=3. 查询此域名是否有历史记录?
http://web.archive.org/c.../web.html4. 全部符合条件,请立即注册!!!!
从查询到注册,时间不要间隔太长,因为好的域名越来越少了,注册的人也越来越多,如果耽
搁几分钟,这个域名就有可能就被别人注册了。
二级域名
二级域名形式如:yourname.site.com,而不是
yourname.com...。拥有自己的独立域名是网站对搜
索引擎友好的基础。目前有很多网站提供免费空间,如博客(Blog)免费空间, 企 业免费空间, 免
费自助建站,电子商务平台等,通常为用户分配一个二级域名,或页面存放 于网站的某一路径下。
使用别人主域名的二级域名的弊端:
解释: 主域名是别人的, 而二级域名是你自己的。例如:www.supercss.com 是某某的,
langchao.supercss.com是自己的。
1.如果你所使用二级域名的主域名受到惩罚,那么你的网站也会受到牵连;
我以前有个网站,做浪潮服务器的,域名langchao.supercss.com 在百度上排名很好,后来
因为
supercss.com... 被百度屏蔽,导致我的浪潮服务器网站也被清除。
2.网站流量排名的时候,你所有的流量都会归功于所依托的顶级域名。
alexa 排名 默认就是顶级域名。
如何规避这些风险呢?
最好为自己的二级域名网站注册一个独立域名,然后做域名转发,对顾客访问和网站管理很有
用。即使有一天你的二级域名的主站停止营业了,你还可以再做一个相同的网站,因为你的独
立域名没有变,老用户仍然可以找到你。
例如:test.supercss.cn,隐藏目的地址: test1.supercss.cn。 通常域名转发是上述方法。
使用别人主域名的二级域名的优势:
1.可以借助主域名的资源,使排名快速提升。
A.举例:汽车,排名在前几位的都是大网站的汽车频道。
B.还要一阵大部分人使用 BLOG进行排名,主要也是利用主站的资源。例如:我的「浪潮
服务器报价」, 在百度里面搜索, 有两个supercss.yourblog.org ,
mmmca.com/blog_supercss/... 都排在第一页。
2.和搜索引擎是一家人,更容易获得认可。
A.百度空间 是百度的一个产品,在百度空间里面发布内容,很容易就可以获得排名。
例如:垂直打击下载 结果记录中就有百度空间。
B.Google Blogger 是google 的博客系统。通常如果你使用自己网站申请Google Adsense 的
时候,可能会被拒绝。但如果你使用 Blogger 来申请的话,就很容易通过了。
使用自己的主域名,发展二级域名的优势:
1.网站流量排名的时候,所有的流量都会归功于所依托的顶级域名。
例如:9126.com 是一个免费域名系统。查看它的 alexa流量,它自己的流量仅仅占23%,其
他都是二级域名的流量。美姬园 。
2.搜索引擎收录时,二级域名算独立的网站,可以扩大收录页面的数量。
例如:site:alibaba.com 时,收录数量达到12,100,000 项;
site:china.alibaba.com 时,有3,070,000 项;
site:blog.china.alibaba.com 时,有414,000 项;
site:wzz331190.blog.china.alibaba.com时,只有1 项。
这就是说,只要不作弊,一个二级或三级域名至少能够收录一页,发展上万个二级域名,使收
录的数量大量增加。
第三部分 主机对SEO 的影响
虚拟主机
现在许多小型企业网站都采用虚拟主机的方式。虚拟主机是使用特殊的软件技术,把一台网站服务
器划分为若干个「虚拟」的主机。每个虚拟主机都可以是一个独立的网站,可以具有独立的域名,
具有完整的Internet 服务器功能(WWW、FTP、Email 等),同一台主机上的虚拟主机之间是完全独
立的。从网站访问者来看,每一台虚拟主机和一立的主机(采用服务器托管、专线上网等方式
建立的服务器)完全一样。
用虚拟主机建设网站具有下列特点:
(1)相对于购买独立服务器,网站建设的费用大大降低,为普及中小型网站提供了极大便
利;
(2)网站服务器服务器管理简单,诸如软件配置、防病毒、防攻击等安全措施都由专业服
务商提供,大大简化了服务器管理的复杂性;
(3)网站建设效率提高,自己购买服务器到安装操作系统和应用软件需要较长的时间,而
租用虚拟主机通常只需要几分钟的时间就可以开通,因为现在主要的服务商都已经实
现了整个业务流程的电子商务化,选择适合自己需要的虚拟主机,在线付款之后马上
就可以开通了。
以上是虚拟主机的优点,当然虚拟主机也有一定的适用范围,有些方面也存在缺点,比如:
(1)某些功能受到服务商的限制,比如可能耗用系统资源的论坛程序、流量统计功能等;
在网站静态化时,通常不能使用IIS_Rewrite 动态库,只能使用404 错误转发处理,使
工作量增加。
(2)网站设计需要考虑服务商提供的功能支持,比如数据库类型、操作系统等;
(3)某些虚拟主机网站访问速度过慢,这可能是由于主机提供商将一台主机出租给数量众多
的网站,或者服务器配置等方面的原因所造成的,这种状况网站自己无法解决,对于网
站的正常访问会产生不利影响;另外如果该主机上有被搜索引擎惩罚的网站,将对你网
站的排名带来潜在风险。
可通过下列工具查看该IP 下有多少个网站:
登录
http://www.seologs.co...ins.html 查询,显示全部域名。
(4)有些服务商对网站流量有一定限制,这样当网站访问量较大时将无法正常访问。
服务器托管
服务器托管是指为了提高网站的访问速度,将您的服务器及相关设备托管到具有完善机房设施、高
品质网络环境、丰富带宽资源和运营经验以及可对用户的网络和设备进行实时监控的网络数据中心
内,以此使系统达到安全、可靠、稳定、高效运行的目的。托管的服务器由客户自己进行维护,或
者由其它的授权人进行远程维护。
数据中心可以为客户的关键服务器提供机柜及带宽出租服务,使服务器可维持每星期七日、全日二
十四小时无休止服务。当您有意建设自己的Web、Email、Ftp 服务器,而您的网站的应用很复杂或
您网站的访问率很高时,您可以选择自已购买服务器,进行整机托管。
托管的服务器在SEO 优化过程中将更灵活,体现在以下方面:
1. 可以自由选择网站静态化策略。
2. 可以查看IIS服务详细日志。参考:如何查看IIS日志?
3. 有利于搜索引擎更快的抓取页面。
影响主机的其他因素:
比如做一些高风险的关键词,比如:六合彩,在国内是禁止的。但在香港是合法的, 如果在国内做
这样的关键词,很可能被封IP,这个时候就需要使用香港的服务器主机了。
但如果做的关键词是国家严格禁止的,比如法*功等,无论网站在何地,都将被屏蔽。
虚拟专用服务器(VPS)
虚拟专用服务器是利用VPS(Virtual Private Server)技术,将一部服务器分割成多个虚拟专享服务
器的优质服务。每个VPS 都可分配独立公网IP 地址、独立操作系统Windows/Linux、独立超大空间、
独立内存、独立CPU 资源、独立执行程序和独立系统配置等。用户除了可以分配多个虚拟主机及无
限企业邮箱外,更拥有独立服务器功能,可自行安装程序,自主重启服务器。
VPS 在SEO 优点:
同托管服务器类似,同样灵活。
VPS 的缺点:
1. 虚拟内存受限制,当内存占用稍大,就会出现http 1.1 和错误。
2. 需要客户对服务器系统安装配置等等都非常熟悉,否则容易引起软件故障。
国外主机
对做海外业务的公司建议选择国外主机,有下列好处:
1.国外的网络速度比国内的要快很多,将使你的网站能够更快的展现给用户,提高用户的体验
度。
2.Google 对国外的网站有比较高的权重。国外很多机构的网站PR 在7 以上,而国内流量很大
的新浪、百度PR 才7。
3.国内很多服务器(虚拟主机)供应商对垃圾邮件发送者管理不严,国内ip 地址又极度缺乏。 因
为你的邮件和网站放置的空间上是多用户(虚拟主机)共享一个ip 地址。 其它人滥发垃圾
邮件,造成国外反垃圾邮件组织和国外提供虚拟主机商对这一ip 地址屏蔽。影响了你正常
的E-Mail 通讯。而国外的服务器对此管理相对较严格,能够保证你正常的E-mail 通信。
4.国外对某些行业政策比较宽松。
主机转移
如果你想转移网站的主机服务,要在取消原来的服务提供商之前,先找好新的供应商。先在新的服
务商处开个帐号,确保所有的文件都正确无误地传到新服务器上。网站在新服务器上运行无碍后再
联系你的原供应商,告知对方将终止合作,但确保他们不会马上关你的网站。再联系你的域名注册
商(可能是原主机提供商),变更域名服务器(DNS)。域名服务器的功能就是把你的域名解析成计算
机能够识别的 IP 地址。把旧的域名服务器改成新的,这个过程到生效时间大概 24-48 小时之内,
少数情况下可能要 72 小时。这期间,如果一个搜索引擎刚好来抓你的网页,要么抓到旧的 IP 地
址上的网站,要么抓到新的域名解析生效后的网站,总之都不会出现网站打不开的空档。
稳定支持
无论选择何种服务器,都一定要保证服务器能够稳定运行。
如果网站在几天内都打不开将严重影响到关键词排名,甚至可能被搜索引擎认为该网站已经不存在
而从索引库中删除。
第四部分 搜索引擎优化的核心:关键词策略
用户是通过关键词找到你的网站的,同时网站优化过程中也是围绕关键词进行的,所以说搜索引擎
优化的核心就是关键词。
关键词选择
通过以下方法选择关键字:
1. 如果是做大众化的网站,可以参考搜索引擎的搜索风云榜。
http://top.ba...com/ 百度搜索风云榜
http://cn.buzz.yahoo.co..._top.html 雅虎风向标
http://www.google....ng/home 谷歌热榜
http://www.sogo.../top/ 搜狗指数
2. 对于专业类的网站 可以向你的客户咨询,了解他们的需求。因为他们是从普通用户的角度来了
解你的产品,他们搜索用的关键词通常和你想像的完全不一样。比如:我最近做的一个网站,
是关于「野山参」的,而用户对这个名称是很陌生的,他们通常使用「人参」来搜索的,所以
后来我就把网站的核心关键词修改成「人参」了。
3. 查看日志,通过日志你可以发现,有些词你没有做过,但用户搜索过来了,这个时候就要加强
这个关键词的优化。
4. 将关键词扩展成一系列词组,如:人参→长白山人参→长白山人参价格。
其他参见:百度相关搜索、Google 关键词工具、Google 网页搜索。
5. 将关键词进行多重排列组合
组合的方式有:同义词、拼错词、拼音、位置颠倒、增加辅助词等。
实例:
越狱 ->《越狱》 :关键词增加引号
哆啦a梦 –>多啦a梦 :常见错别字 前者有 2014 个搜索量,后者917 个搜索量。
汽车->qiche : 使用拼音 前者有132582 个搜索量,后者有1291 个搜索量。
北京 体检 ->体检 北京:搜索的结果不同,相对难度也不同。
seo 什么意思->什么是seo : 对关键词进行解释,符合人们的搜索习惯。
6. 不要使用通用词。
如果你是做软件下载的,那「软件下载」是你的核心关键词,而「软件」是个非常通用的词汇,
用户在搜索下载网站时,也不会仅仅使用「软件」这一个关键词来搜索的,通常是多个词组合
在一起。
不好的例子:中国金属商务网 ,它的标题及关键词:
<title>中国金属商务网 ---- 钢铁 钢材 中厚板 带钢 无缝管 焊管 优钢 不锈钢
铜 镍 铁合金 铁矿石 价格行情走势</title>
<meta name="description" content="供求信息/金属/黑色/有色/不锈钢/">
<meta name="keywords" content="黑色,有色,不锈钢,炉料,供求信息,市场行情,每
日分析,价格走势,会展大全,资料库,商务助手,企业黄页,技术交流,企业专版,企业报价,行业资讯,钢厂价格,关键字广告,短信服务,进出口统计,论坛">
很多了,它在搜索任何一个关键词里面都没有找到 中国金属商务网。
7. 使用地理位置
例如:搜索网站建设, 找到相关网页约29,400,000 篇,而且前10 个全是竞价;而搜索深圳网
站建设 找到相关网页约4,940,000 篇,有9 个竞价。 这样不仅可以降低排名的难度,而且更容
易找到真正的客户。
在使用地理位置时要从客户的角度考虑。
比如 邮箱 ,这里面就没有「北京邮箱」这个词,所以地理位置对它来说没有任何意义。
总结一下:有些需要面对面谈的业务,比如网站建设 SEO 等等,都有地区之分。而纯粹是网上
的业务,比如 邮箱、论坛等等这些是没有地区分别的。
8. 确定关键词搜索量。
关键词选择好了,还要看看有没有人搜索,每天的搜索量多少,否则即使排名做上去了,也获
得不了流量的。
参见以下:
中文关键词:百度指数
英文关键词:Keyword Selector Tool
9. 长尾关键词的选择
例如:抗肿瘤药有这些:丝力霉素、更生霉素、光辉霉素、氮芥类、氨甲蝶呤、巯嘌呤(6-MP)、
门冬酰胺酶、农吉利碱。图中红色的部分相当于抗肿瘤药等关键词的搜索量,而后面黄色的是
其他具体药,如丝力霉素的搜索量。假设这些词都能够做上去了,抗肿瘤药每天能带来80IP 的
流量,而丝力霉素每天只能带来10IP 的流量。但两者的购买转化率是不同的,抗肿瘤药是个通
用词汇,更多的是普通大众搜索的词,他们是想了解一下有哪些药,转化率比较低;而丝力霉
素等是专业关键词,使用这个词的通常是经常吃这个药的患者或者医生等,更多是要购买此药,
转化率比较高。由于专业关键词搜索量少,竞争也少,往往容易做上去。
10. 关键词的时间效应:
通常热门关键词热度过了后,流量就掉的很厉害,是不是这个时候就可以删除这个关键词呢?
不是,我举个例子:我2006 年做了一个关键词,七夕短信,当时流量不是很多,等2007 年七
夕的那几天,这个关键词每天给我带来上千的流量。对于有时间范围的关键词,比如:春节时
期的火车票,七夕短信需要提前做,并长年维护,才能保证在该时间范围内排名靠前。
例子:七夕短信Google趋势
11. 查看你的竞争对手网站选择的关键词。
在搜索引擎中搜索你竞争对手做的比较好的网站,将他们的网页都浏览一遍,看看他们选择了
哪些关键词,可以给你一些提示。
12. 有些词是从百度的相关搜索中过来的,而非用户搜索的关键词。
比如网上比较热传的丘仕达的每天搜索量过万的「www 163.com 邮箱」这个关键词,是由于
「163.com」的搜索量非常大,达到每天19867 次,但结果记录只有一个,这时用户自然会点击
相关搜索中的关键词。
正因为相关搜索有此效应,一些人会通过作弊的方式将一些关键词做到百度相关搜索里,然后
获得真实的搜索量。
13. 查询关键词的竞争对手。
在最终确定一个关键词后,还要看有没有竞争对手,竞争对手少的词更容易做上去。
参考:如何判断关键词的优化难度?
最好的关键词是那些没有被广泛滥用而又很多人搜索的词。
14. 自己创建新的关键词。
当主营业务的关键词竞争特别激烈的时候,可以尝试创建新的关键词,用此关键词来描述产品,
开创属于适合自己的蓝海。不过此方法需要对新的关键词进行大规模的宣传,成本过高。
例如:蒙牛的「特仑苏」在蒙语中是「金牌牛奶」之意,也是蒙牛的一个牛奶品牌。
15. 所有的词都可以做上去么?
回答是否定的,哪些词做不上去呢?参见:哪些词在百度里面是做不上去的呢?
选择词时尽可能避开这些词。
关键词密度
在确定了自己的关键字之后,需要在网页文本中适当出现这些关键字。
控制关键词数量:
一页中的关键词最好只有一个,然后所有内容都围绕这个关键词展开 ,才能保证关键词密度合理。
如果确实有大量关键词需要优化, 可以分散写在其它页面并有针对性的优化。最典型的情况是拥有
不同的产品和服务的情况下,对每个产品进行单网页优化,而不是罗列在一个首页上。
比如:火车票,排名在前面的
http://train.pi...m.cn/,这个页面,就只针对「火车票」:
<title>火车票查询-北京火车票-上海火车票-广州火车票-二手火车票-转让|求购火车票-中国票务在线
火车票网</title>
而
http://fly.pia....cn/ 这个页面,就只针对「机票」:
<title>机票-北京飞机票-上海飞机票-广州飞机票-飞机票价格查询-中国票务在线</title>
飞机票排名第二页。飞机票。
关键字密度 (Keyword Density):
就是在一个页面中,关键词的数量占所有该页面中总的词数量的百分比,该指标对搜索引擎的优化
起到重要作用。关键字密度一般在 3% 到5% 较为合适,超过这一标准就有过高或过低之嫌。
计算方法:
例如:珠穆朗玛峰 高度
公式:关键词数量/总词数量=关键词密度
「珠穆朗玛峰」 关键词密度是 50%
「高度」 关键词密度是 50%
以下按字数计算是错误的:
「珠穆朗玛峰」 关键词密度是 5/7 -> 71%
「高度」 关键词密度是 2/7 -> 29%
获得关键词密度:
1. 使用FireFox 工具可以查看关键词密度,不过不是很准确:
SeoQuake (FireFox) ,SearchStatus (FireFox)
2. 登录网站
http://tools.hxstat.com/...nsity.asp 拷贝网页内容,输入关键词。
参见:如何提高关键词密度?
关键词分布
1. 网页代码中的 Title,META 标签(关键字 keywords 和描述 description)
例如:浪潮服务器报价
<title>浪潮服务器报价|服务器报价</title>
<meta name="keywords" content="浪潮服务器报价|服务器报价">
<meta name="description" content="销售全系列浪潮英信服务器,提供优惠的价格。本页提供全系
列浪潮服务器报价。">
2. 正文内容必须适当出现关键词
正文内容必须适当出现关键词,并且「有所侧重」,意指用户阅读习惯形成的阅读优先位置 --
从上到下,从左至右--成为关键词重点分布位置,包括:页面靠顶部、左侧、标题、 正文前
200 字以内。在这些地方出现关键词对排名更有帮助。如我的 SEO 培训网站 将网站的描述放
在网站的最上面,这样做的好处是让用户和蜘蛛都以最快速度了解该网站内容,并且以蜘蛛重
视的<h1>黑体显示,对其排名作用很大。代码显示如下:
<h1 id="BlogTitle"><a href="
http://www.se....cn/"><h1>SEO 培训</h1></a></h1>
<h2 id="BlogSubTitle"><br><br>提供SEO 培训、SEO 教程、网站分析等服务,咨询:
刘志军 13911374501</h2>
3. 超链接文本(锚文本)
例如:www.seo165.com
<a href="
http://www.se....com" id=nlinkmenu1 title="搜索引擎优化,seo"><font color="#000000">
搜索引擎优化</font></a>
4. Header、Strong、B 等标签
即正文标题<H1><H1/>中的文字。搜索引擎比较重视标题行中的文字。用<b></b>加粗的文字 往
往也是关键词出现的地方。
其他标签:h2-h5 ,strong
对于英文关键词来说,大写的关键词权重大于小写的关键词。
其他标签参见:<span style=』 font-weight : bolder;』>关键词</span> 作用是否和<strong>一样呢?
5. 图片 Alt 属性
搜索引擎不能抓取图片,因此网页制作时在图片属性 Alt 中加入关键字是对搜索引擎友好的,
它会认为该图片内容与你的关键字一致,从而有利于排名。
<img align="center" src="NP110.jpg" alt="浪潮英信NP110 G2 服务器图片">
6. 域名及路径、文件名
英文网页内容的网站在进行域名选择和网页文件夹命名时,也可以考虑包含关键字(对关键 词
组则要用短横线隔开),如
made-in-china.com...。不过对 Google 排名作用非常微小。
在google里面搜索langchao,域名或目录中带有langchao的字母就便绿。
排在第四的 langchao.supercss.com,是我的网站,我并没有针对langchao单词做过任何的优化,
只在路径中存在这个字母,说明域名路径中出现关键词还是有作用的
7. 文件注释中
页面代码中经常会有关于页面内容的注释。例如<!-长白山人参图片 -->
第五部分 对搜索引擎友好的网页设计
Title 和 Meta 标签
标题(Title):
网页优化可以说是从 Title 开始的。在搜索结果中,每个抓取内容的第一行显示的文字就是该页的
Title,同样在浏览器中打开一个页面,地址栏上方显示的也是该页的 Title。因此, Title 可谓一个
页面的核心。对 Title 的书写要注意以下问题:
1、title 简短精炼,高度概括,含有关键词,而不是只有一个网站名称。但关键词不宜过多,不要超
过 3 个词组。
2、前7 个字对搜索引擎最重要,因此关键词位置尽量靠前,总字数不超过30 个汉字。
例如:Google 手机搜索,可以看到排在前面的几个都是大公司手机频道, 手机这个词是排在最前
面的。
Meta 属性 关键词(Keywords):
Keywords 提示搜索引擎:本网站内容围绕这些词汇展开。
因此 keywords 书写的关键是每个词都能在内容中找到相应的匹配才有利于排名。
例如:网易 手机频道,关键词是 「手机,手机报价,诺基亚,摩托罗拉 」。
不过最近搜索引擎对Keywords 属性的权重降低,不如原来那么重要了。
描述(Description):
描述部分用简短的句子告诉搜索引擎和访问者关于本网页的主要内容。用该网站的核心关键词搜索
后得到的搜索结果中,描述往往显示为标题后的几行描述文字。Description 一般被认为重要性在
title 和 keywords 之后。描述的书写要注意以下问题:
1. 描述中出现关键词,与正文内容相关,这部分内容是给人看的,所以要写的很详细,让人感兴趣,
吸引用户点击。
2. 同样遵循简短原则,字符数含空格在内不要超过 120 个汉字。
3. 补充在 title 和 keywords 中未能充分表述的说明 。
例如:www.51edu.com 的在Google搜索结果里面描述:中国领先的教育门户和国内最大的招生引擎,
为用户提供万门优质课程优惠报名服务,为教育机构提供基于互联网的招生营销、市场管理、品牌
宣传等专业化服务。
另外百度对页面最开始的内容比较感兴趣,通常以这部分内容作为显示结果。
例如:http://www.baidu.com/s?wd=site%3Awww.51edu.com&cl=3 显示的页面菜单栏:
首页 商学院/研究生 高考 中小学 外语 IT 职业教育 管理 考研 留学 音乐美术体育 使馆文教处
专区 社区 高级搜索 拉萨尔三年国际本科 考研
其它 Meta 标签:
为了限制搜索引擎对内容的抓取,可以采用以下几个 Robots Meta 标签:
<meta name="Robots" content="all|none|index|noindex|follow|nofollow|noarchive">
其中:all:文件将被检索,且页面上的链接可以被查询;
none:文件将不被检索,且页面上的链接不可以被查询;
index:文件将被检索;
follow:页面上的链接可以被查询;
noindex:文件将不被检索,但页面上的链接可以被查询;
nofollow:文件被检索,页面上的链接不被查询。
noarchive:文件不被缓存
这些值是可以组合在一起使用。
说道这里,不得不提一下Google 另外的一个属性 rel="nofollow"。使用方法:
<a rel="nofollow" href="
http://www.12....com" > 小电影 </a>
作用呢:就是告诉搜索引擎这个链接不是经过作者自己编辑的,所以这个链接不是一个可信任的链
接。 搜索引擎看到这个标签就可能减少或完全取消链接的投票权重。
但并不是所有的搜索引擎都支持 meta 中的 robots 标签。
综合运用样例:
<title>亲子教具-万花筒儿童教育集团</title>
<meta name="Robots" content="all">
<meta name="keywords" content="亲子教具">
<meta name="description" content="对于亲子教师来说系统完善的亲子游戏教具是他
们在亲子活动前必不可少的实用性素材,北京智泉万花筒教育研究院亲子中心为教师及
加盟商提供全套的亲子游戏教具">
访问结构
访问结构即通过几层能够访问到最终页面,Google 最好为三层,百度不限。
较好的例子:
以
seochat.org...为例。
seochat.org...首页为第一层,百度优化为第二层, 百度如何优化为第三层。
这样的结果便于搜索引擎索引。百度如何优化 这个页面在百度和 google 里面都有收录。
二级域名访问结构:
由于三层的目录,容纳的页面有限,需要多级目录。
这个时候使用前面我们讲过的二级域名方式扩大级数。因为二级域名算独立网站,目录层次从当前
二级域名算起。
外部访问结构:
有的网页在本网站层数很多,但也被Google 收录,这是因为这些网页在被其他网站引用,而Google
从其他页面进入这个页面。可以使用 link 命令查询该页的反相链接。
目录和文件命名
目录和文件名称中的关键词
目录名称和文件名称中可以使用到关键词。如果是关键词组,则需要用分隔符分开。我们常用连字
符「-」和下划线「_」进行分隔,URL 中还经常出现空格码「%20」。因此,如果以「中国制造」作
文件名,就可能出现以下三种分隔形式:
made-in-china.htm
made_in_china.htm
made%20in%20china.htm
连在一起之后,关键词就失去了意义。但事实上,至少在目前 Google 并不认同「_」为分隔符。对
Google 来说, made-in-china 和 made%20in%20china 都等于 made in china,但 made_in_china 就
被读成了 madeinchina,
因此,目录和文件名称如果有关键词组,要用连字符「-」而不是下划线「_」进行分隔。
URL 应该越短越好
有人为了单纯增加关键字而额外建多一个带有关键字的子目录,改变目 录结构。由于 URL 中含有
关键字本身对排名提高帮助并不大,因而这种做法多此一举,也是搜索引擎反感的。
不好的例子:
要做英文关键词 computer,这样的目录
http://www.ibm.com/computer...mputer.html 是错
误的。
好的例子:
http://www.ibm.c...puter/ 该目录在根目录下的第一级,权重相对第二级较大。
GB2312 中文路径
现在搜索引擎对GB2312 的中文URL 能正常收录了。优化无处不在,URL 上的关键词相比标题权
重要少一些,但还是有效,有条件可以增加上。
http://www.google....ch?comp ... Avomv.com&meta=
http://www.baidu.c...=site%3 ... 9%A4%B7%BB&cl=3
http://search.cn.y...m/searc ... =UTF-8&meta=all
动态网页静态化
本章在线视频:www.xue24.com,免费下载该视频教程: rewrite_demo.rar,运行里面的play.htm,如
果不能看就执行demo\content.htm 文件,或者可以下载课件插件。
虽然大多数搜索引擎的蜘蛛程序现在基本都可以解读符号「?」后的字符,但搜索引擎更喜欢静态文
件,所以要对动态网页静态化。
在介绍静态化之前,介绍一些常用的正则表达式:
符号 匹配字符 示例
\d 任何十进制数字 等价于[0-9]
\D 任何非数字 等价于[^0-9]
\s 任何空白字符 空格、制表符、分页符
\S 任何非空白字符 等价于「[^\f\n\r\t\v]」
\w 任何单词字符 等价于「[A-Za-z0-9_]」
\W 任何非单词字符 等价于「[^A-Za-z0-9_]」
\n 回车换行
. 除 \n 以外的任何字符 (.)+ 匹配除换行符以外的所有字符串
? 0个或1个前面的字符 ab?c? 可以且只能匹配「abc」、「abbc」、「abcc」
和「abbcc」
* 零个或多个所有的字符 ab* 可以匹配「ab」、「abb」、「abbb」
+ 一个或多个所有字符 ab+ 可以匹配「abb」、「abbb」等,但不匹配「ab」
{n} n表示数量 如果是2,表示2个字符 a{2} 可以匹配「aa「,但不匹配「a」
{n,n}
从几个字符开始到几个字符结束,如
果不写,表示至少或者至多
a{3,} 匹配「aaa」、「aaaa」等,但不匹配「a」和「aa」。
x|y 匹配「x」或「y」 「ab(c|x)yz」匹配 「abcyz」和「abxyz」
\? \. \* \+ ? . * +
了解更多正则表达式,请下载:正则表达式教程
这里我介绍几种静态化方法:
1. 使用IIS_ReWrite 静态化处理,适合PHP、ASP、ASP.NET 程序。
A. isapi_rewrite.isapi_rewrite分精简(lite)和完全(full)版.精简版不支持对每个虚拟主机站点进行
重写,只能进行全局处理,精简版下载地址 ISAPI_Rewrite 2.7 For IIS 。
B. 打开IIS,选择网站,右键菜单属性,添加过滤器。如图:
C. 打开文件:开始菜单->程序->Helicon->ISAPI_Rewrite->httpd.ini
D. 将 RewriteRule /user/(\d+).htm /user.asp\?id=$1 [I,O] 加入内容中。
E. 在浏览器地址栏输入:/user/1.htm 页面将指向 /user.asp?id=1。
2. 使用虚拟主机的ASP 网站,需要使用404 错误操作实现静态化。
A. 下载 404 处理页面。404_Rewrite_GB2312.rar
B. 解压后将Rewrite.asp、 error.asp 放在网站的根目录。
C. 设置网站自定义错误信息如图:
D. 在error.asp 里添加处理命令:
Call ParaseUrl("/(\d+).htm","/user.asp?User=$1")
E. 在需要静态化的实例user.asp 页面中添加代码:
<!-- #include virtual="/rewrite.asp" --> 引用文件
<%
response.write "<li>Para=" & session("Para") 『变量是通过Session 传递
『原来使用request(「user」)获得参数的命令,需要修改成request_(「user」)调用
response.write "<li>request_(""User"")=" & request_("User")
『原用request.querystring (「user」)获得参数命令,修改为request__.querystring (「user」)调用
response.write "<li>request__.querystring(""User"")=" & request__.querystring("User")
%>
F. 在地址栏输入/1.htm ,实际调用 /user.asp?user=1
3. 使用asp.net 开发的网页程序,使用URLRewriter.dll 实现静态化。
1. 下载 URLRewriter.rar,解压后放在/bin/目录下
2. 将URLRewriter.rar 加入工程引用。
3. 配置IIS 站点 ,将扩展名为html 指向处理程序 aspnet_isapi.dll。
IIS 站点->属性->主目录->配置->添加
可执行文件和aspx 处理相同,都是
c:\windows\microsoft.net\framework\v2.0.50727\aspnet_isapi.dll
特别注意,一定不要选择 检查文件是否存在。
4. 在web.config 中添加配置内容,压缩包里有。
<configSections>
<section name="RewriterConfig"
type="URLRewriter.Config.RewriterConfigSerializerSectionHandler, URLRewriter" />
</configSections>
<!-- 实际重定向 -->
<RewriterConfig>
<Rules>
<RewriterRule>
<LookFor>~/(\d*).html</LookFor>
<SendTo>~/user/default.aspx?link=$1</SendTo>
</RewriterRule>
</Rules>
</RewriterConfig>
<system.web>
<!--
需要在IIS 里面增加html 引用,改成aspx 的引用
-->
<httpHandlers>
<add verb="*" path="*.aspx"
type="URLRewriter.RewriterFactoryHandler, URLRewriter" />
<add verb="*" path="*.html"
type="URLRewriter.RewriterFactoryHandler, URLRewriter" />
</httpHandlers>
5. 在地址栏输入
http://localho...html 指向
http://localhost/user/d...px?link=14. 基于Apache HTTP Server 静态化
Apache Web Server 的配置 (conf/httpd.conf )
1. 在httpd.conf 文件中查找 LoadModule rewrite_module modules/mod_rewrite.so
通常该行被注释,去掉「#」。如果没有就增加该行。
2. 加入代码:
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteRule ^/([0-9]+).html$ /user.php?user=$1
</IfModule>
3. 如果网站使用通过虚拟主机来定义,请务必将代码加到虚拟主机配置文件.htccess 中去,否
则可能无法使用。
4. 重启Apache,重新载入配置。
5. 在地址栏输入
http://localho...html ,实际指向
http://localhost/u...?user=15. 静态化后文件格式
链接静态化后可以是html 文件,也可以是目录,通常目录的权重大于文件的权重,可以在搜索
引擎中获得更好的排名。
例如:优化前:http://www.supercss.com/user.asp?id=1
优化后 文件:http://www.supercss.com/user/1.html
目录:http://www.supercss.com/user/1/
同等条件下http://www.supercss.com/user/1/ 有更高的优先权。
框架结构
框架结构,即帧结构(Frame),包括IFrame,Frame。
例如:框架结构示例。
<frameset rows="97,*" cols="*" frameborder="yes" border="0" framespacing="0">
<frame src="top.html" name="topFrame" frameborder="no" scrolling="No" noresize="noresize"
id="topFrame" title="topFrame" />
<frameset rows="*" cols="164,*" framespacing="0" frameborder="no" border="0">
<frame src="search_left/cat20.html?&catid=20&redirect=n" name="left"
frameborder="no" scrolling="yes" id="left" title="leftFrame" />
<frame src="CPU/cat20_list_1.html" name="main" id="main" scrolling="yes"
title="main">
</frameset>
</frameset>
<noframes>
在这里进行优化!
增加链接 <a href=」
http://intozgc.com/CPU...st_1.html」 title=」 CPU报价」> CPU报价</a>
</noframes>
框架型网站的优越性体现在页面的整体一致性和更新方便上。尤其对于那些大型网站而言, 框架结
构的使用可以使网站的维护变得相对容易。但框架对搜索引擎来说是一个很大的问题,这是由于大
多数搜索引擎都无法识别框架,也没有什么兴趣去抓取框架中的内容。此外, 某些浏览器也不支持
框架页面。
如果网页已经使用了框架,或出于某种原因一定要使用框架结构,则必须在代码中使用 「Noframes」
标签进行优化,把 Noframe 标签看做是一个普通文本内容的主页。在 <Noframe></Noframe>区域
中包含指向 frame 页的链接以及带有关键词的描述文本,同时在框架以外的区域(title,meta)也出现
关键词文本。这样,搜索引擎才能够正确索引到框架内的信息。
还有一个办法是采用 iframe 即内联框架(Inner Frame)技术来避免 Frame 带来的不便。所
谓 iframe 也是框架的一种形式,它是相当于在主浏览器窗口中内嵌一个子窗口,内容自动
打开。iframe 可以嵌在网页中的任意部分,也可以随意定义其大小,其代码显示为:
实例:<iframe src=xx width=x height=x scrolling=xx frameborder=x></iframe>
对搜索引擎来说,iframe 中的文字是可见的,也可以跟踪到其中链接指向的页面,不过与
用户所见不同的是,搜索引擎将 iframe 内容看成单独的一个页面内容,与被内嵌的页面无
关。
图像优化
一般而言,搜索引擎只识读文本内容,对图片文件是视而不见的。同时,图像文件直接延缓页面加
载时间,如果超过 20 秒网站还不能加载,用户极有可能离开你的网站。因此, 除非你的网站内容
是图片为主,比如游戏站点或者图片至关重要,否则尽量避免使用大图片, 更不要采用纯图像制作
网页(SPLASH PAGE)。
网站图片优化的有以下几点:
1. 在保持图像质量的情况下尽量压缩图像的文件大小。
2. Alt 属性:
每个图像<IMG>标签中都有 ALT 属性,搜索引擎会读取该属性以了解图像的信息。因此,最好
在所有插图的 ALT 属性中都有文字描述,并带上该页关键字在其中。
比较好的例子:
<img align="center" src="NP110.jpg" alt="浪潮英信NP110 G2 服务器图片" >
3.在图片上方或下方加上包含关键词的描述文本;
4.使用链接链接到这个图片。
例如:Google 图片搜索 NP370 浪潮英信NP370 G2 排名第一。
Google的图像搜索(Googlebot-Image)和Google的文本搜索(Googlebot)不是同一个蜘蛛。
应用实例:
FLASH 优化
Flash 会使页面很好看,不过FLASH 网页有一个非常致命的问题,即大部分搜索引擎无法识别
FLASH 中的信息。
例如:一汽轿车
FLASH 优化可以从以下几个方面来考虑:
1、做一个辅助 HTML 版本:
保留原有 FLASH 版本的同时,还可以设计一个 HTML 格式的版本,这样既可以保持动态
美观 效果,也可以让搜索引擎通过 HTML 版本的网页来发现网站。
2、将 Flash 内嵌 HTML 文件:
还可以通过改变网页结构进行弥补,即不要将整个网页都设计成 Flash 动画,而是将 Flash
内容嵌入到 HTML 文件中,这样对于用户浏览并不会削弱视觉效果,搜索引擎也可以从
HTML 代码中发现一些必要的信息,尤其是进入内容页面的链接。
表格使用
表格是网页最重要的排版方式。
1.如果某个网页采用了大段的长篇文本,除了可以将一页文本分成多面,还可以考虑将文本置入
不同表格中,这样不仅管理方便,也使得该页加载时每个 表格内容依次加载,这样访问者就可
以一边看已下载内容一边等待剩余部分加载,而不是等 待很久之后才一齐加载出来。
例如:新浪新闻
2.表格之内套嵌太多表格也不利于页面加载,因浏览器是先加载完大表格之后再加载内嵌的小
表格,因此内嵌表格会最终降低整页加载速度。
3.尽量采用XHTML标准,使用DIV代替表格。
具体方法是采用CSS里面的 FLOAT 属性,position 属性等定位
使用FLOAT 属性的例子。复杂三栏式版面
使用position 属性等定位。复杂版面设计.htm
网页减肥
代码设置不妥不仅延长网页加载时间,也严重影响蜘蛛程序对网页内容的抓取。通过对网页代
码进行清减去掉臃肿杂乱的代码,减小网页文件大小,能够加快网页加载速度,让蜘蛛快速索引到
重要内容。整个网页最好不要超过30K,文字内容最好5K-10K 之间,Google 只对内容的前5000 个
字进行索引。
网页减肥重点涉及以下几个要点:
1.CSS 样式
网页制作应通过 CSS(层叠样式表单)来统一定制字体风格。 例如:
<b style="color:red;font-size:16px;">测试</b>
<div id="divmain" style="font-size:12px;">DIV</b>
<div style="color:red;"> 红色 <b style="color:green;">绿色</b> </div>
----------------------
<style type="text/css">
b { color:red;font-size:16px; } /*通用对像*/
#divmain {font-size:12px;} /* ID 对像 */
.red {color:red;}/* 定制类别 */
.red b {color:green;}/* 定制类别下的 通用对像*/
</style>
<b>测试</b>
<div id="divmain">DIV</b>
<div class="red"> 红色 <b>绿色</b> </div>
CSS 减肥示例文件 把文字的字体、字号、颜色、背景色等统一起来,不用对每段文字单独进行
格式定义,从而减少大量重复性标签。注意把所有 css 文件单独存放在命名为 css 的外 部文件
中。
语法: <link rel="stylesheet" type="text/css" href="/common/client.css">
作用的优先级:自身的style属性 > 页面的内部style对像 > 页面外部css文件。
下载:css帮助
2.JavaScript:
1. 简化js中的函数名称和变量。
例如:Google,里面的函数名称只有1 个或者2 个字符。
2. 将网页的公共部分转换为脚本并存于js 文件里。这样可以减少文件大小,加快下载速度,同
时也方便管理。不过不能将导航等等优化的关键代码转换成js,否则搜索引擎搜索不到。
转换方式:
原来:<h1>天天收藏夹</h1>
脚本:document.write(「<h1>天天收藏夹</h1>」);
例如:华军软件园 源代码,将标题、导航等等都放着js文件里,将导航放在js里面就不太好
了。
3.使用base 标签:
Base 标签是一个全集控制的标签。
比如:
<A HREF="
http://www.supercss...e/1.htm " target=_blank」>代码一</A>
<A HREF="
http://www.supercss...e/2.htm " target=_blank」>代码一</A>
其中
http://www.sup....com 和 target=_blank」: 多次重复,增加无用的代码。
修改为:
<head>
<base href=」http://www.supercss.com/」 target=」_blank」>
</head>
<body>
<a href=」/code/1.htm」>代码一</a>
<a href=」/code/2.htm」>代码二</a>
</body>
4.慎用网页减肥工具
通常的网页减肥工具,对htm 减肥具有一定的破坏性,常常为了减肥将标签的 后半个标签删除,
造成网页的不完整。
处理前:<table><tr><td>第一行</td></tr><tr><td>第二行</td></tr></table>
处理后:<table><tr><td>第一行<tr><td>第二行</table>
处理后 </td></tr> 被去掉了,使页面不完整。
5.删除空格和回车
如果要更加苛刻的减肥,那最后一步就是删除空格了,还可以使文件大小下降很多。
不过删除空格后的页面由于没有阶梯排列,将很难读懂。
例子:百度首页的代码就非常紧凑。
不同位置的网页优化
网站首页优化:
1. 关键词选择
首页的关键词应该选择核心关键词。通常这些词优化难度比较大,需要大量的外部链接。交换
链接的时候以网站名称或者核心关键词命名链接。参见:域名及网站名称中的关键词
例如:在搜索引擎优化行业,首页的关键词应该是SEO。
2. 网页链接
首页大部分都是链接,最新的链接要放在网页的前面,便于搜索引擎收录。
3. 更新频率
蜘蛛第一个来到的页面就是首页,首页一定要经常更新,蜘蛛就会来的比较频繁,链接的页面
将会更快被收录。
栏目页优化:
1. 关键词选择
栏目页的关键词,相对首页,可以选择次一些的关键词,以核心「SEO」为例,栏目也可以是「SEO
培训」,「SEO 教程」等。
2. 内部链接
栏目页一定要链接到首页,为首页建立内部链接。同时和其他栏目页也要相互链接。
栏目页大量的链接内容页,链接数量控制在100 个以内。
内页优化:
1. 关键词
内页可以不特别关注关键词,可以将Meta Title 设置成相同的内容。在页面里更多的利用H1,
IMG、STRONG 标签优化关键词。
2. 内容
网页要以内容为主,大于5K 时,可以做翻页处理。内容最好是原创,内页收录的越多,从搜索
引擎来的流量才能越多。
3. 链接
通常内页很少有外部链接的,除非内容非常好,被人转载。内页要链接栏目页和首页,大量的
内页链接,有利于栏目页和首页的关键词排名。内页最好能链接内容相关的其他内页,这样可
以增加网页的相关度,同时方便用户浏览,增加网站的PV。
Robots.txt
搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。
您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot 访问的
部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定
的内容。robots.txt 文件应该放在网站根目录下。
robots.txt 文件的格式:
"robots.txt"文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL 作为结束符),
每一条记录的格式如下所示:
"<field>:<optionalspace><value><optionalspace>"。
在该文件中可以使用#进行注解,具体使用方法和UNIX 中的惯例一样。该文件中的记录通常以一行
或多行User-agent 开始,后面加上若干Disallow 行,详细情况如下:
User-agent:
该项的值用于描述搜索引擎robot 的名字,在"robots.txt"文件中,如果有多条User-agent 记录说
明有多个robot 会受到该协议的限制,对该文件来说,至少要有一条User-agent 记录。如果该项的值
设为*,则该协议对任何机器人均有效,在"robots.txt"文件中,"User-agent:*"这样的记录只能有一条。
Disallow:
该项的值用于描述不希望被访问到的一个URL,这个URL 可以是一条完整的路径,也可以是
部分的,任何以Disallow 开头的URL 均不会被robot 访问到。例如"Disallow:/help"对/help.html 和
/help/index.html 都不允许搜索引擎访问,而"Disallow:/help/"则允许
obot 访问/help.html,而不能访问
/help/index.html。任何一条Disallow 记录为空,说明该网站的所有部分都允许被访问,在"/robots.txt"
文件中,至少要有一条Disallow 记录。如果"/robots.txt"是一个空文件,则对于所有的搜索引擎robot,
该网站都是开放的。
robots.txt 文件用法举例:
例1. 禁止所有搜索引擎访问网站的任何部分
下载该robots.txt文件
User-agent: *
Disallow: /
例2. 允许所有的robot 访问 ( 或者也可以建一个空文件
"/robots.txt" file)
User-agent: *
Disallow:
例3. 禁止某个搜索引擎的访问
User-agent:
BadBot
Disallow: /
例4. 允许某个搜索引擎的访问
User-agent:
baiduspider
Disallow:
User-agent: *
Disallow: /
例5.一个简单例子
在这个例子中,该网站有三个目录对搜索引擎的访问做了限制,
即搜索引擎不会访问这三个目录。
需要注意的是对每一个目录必须分开声明,而不要写成
"Disallow: /cgi-bin/ /tmp/"。
User-agent:后的*具有特殊的含义,代表"any robot",所以在该
文件中不能有"Disallow: /tmp/*" or "Disallow:*.gif"这样的记录出现.
User-agent: *
Disallow:
/cgi-bin/
Disallow: /tmp/
Disallow: /~joe/
Robot 特殊参数:
1. Google
允许 Googlebot:
如果您要拦截除 Googlebot 以外的所有漫游器访问您的网页,可以使用下列语法:
User-agent:Disallow:/
User-agent:Googlebot
Disallow:
Googlebot 跟随指向它自己的行,而不是指向所有漫游器的行。
"Allow"扩展名:
Googlebot 可识别称为"Allow"的 robots.txt 标准扩展名。其他搜索引擎的漫游器可能无法识别此
扩展名,因此请使用您感兴趣的其他搜索引擎进行查找。"Allow"行的作用原理完全与"Disallow"
行一样。只需列出您要允许的目录或页面即可。
您也可以同时使用"Disallow"和"Allow"。例如,要拦截子目录中某个页面之外的其他所有页面,
可以使用下列条目:
User-Agent:Googlebot
Disallow:/folder1/
Allow:/folder1/myfile.html
这些条目将拦截 folder1 目录内除 myfile.html 之外的所有页面。
如果您要拦截 Googlebot 并允许 Google 的另一个漫游器(如 Googlebot-Mobile),可使用
"Allow"规则允许该漫游器的访问。例如:
User-agent:Googlebot
Disallow:/
User-agent:Googlebot-Mobile
Allow:
使用 * 号匹配字符序列:
您可使用星号 (*) 来匹配字符序列。例如,要拦截对所有以 private 开头的子目录的访问,可使
用下列条目:
User-Agent:Googlebot
Disallow:/private*/
要拦截对所有包含问号 (?) 的网址的访问,可使用下列条目:
User-agent:*
Disallow:/*?*
使用 $ 匹配网址的结束字符
您可使用 $ 字符指定与网址的结束字符进行匹配。例如,要拦截以 .asp 结尾的网址,可使用
下列条目:
User-Agent:Googlebot
Disallow:/*.asp$
您可将此模式匹配与 Allow 指令配合使用。例如,如果 ? 表示一个会话 ID,您可排除所有包
含该 ID 的网址,确保 Googlebot 不会抓取重复的网页。但是,以 ? 结尾的网址可能是您要包
含的网页版本。在此情况下,可对 robots.txt 文件进行如下设置:
User-agent:*
Allow:/*?$
Disallow:/*?
Disallow:/ *?一行将拦截包含 ? 的网址(具体而言,它将拦截所有以您的域名开头、后接任意字
符串,然后是问号 (?),而后又是任意字符串的网址)。
Allow: /*?$ 一行将允许包含任何以 ? 结尾的网址(具体而言,它将允许包含所有以您的域名开
头、后接任意字符串,然后是问号 (?),问号之后没有任何字符的网址)。
Sitemap 网站地图:
对网站地图的新的支持方式,就是在robots.txt 文件里直接包括sitemap 文件的链接。
就像这样:
Sitemap:
http://www.supercss...dex.xml目前对此表示支持的搜索引擎公司有Google, Yahoo, Ask and MSN。
不过,我建议还是在Google Sitemap 进行提交,里面有很多功能可以分析你的链接状态。
Robots.txt 带来的好处:
1. 几乎所有的搜索引擎Spider 都遵循robots.txt 给出的爬行规则,协议规定搜索引擎Spider 进
入某个网站的入口即是该网站的robots.txt,当然,前提是该网站存在此文件。对于没有配置
robots.txt 的网站,Spider 将会被重定向至404 错误页面,相关研究表明,如果网站采用了自
定义的404 错误页面,那么Spider 将会把其视作robots.txt--虽然其并非一个纯粹的文本文
件--这将给Spider 索引网站带来很大的困扰,影响搜索引擎对网站页面的收录。
2. robots.txt 可以制止不必要的搜索引擎占用服务器的宝贵带宽,如email retrievers,这类搜索
引擎对大多数网站是没有意义的;再如image strippers,对于大多数非图形类网站来说其也
没有太大意义,但却耗用大量带宽。
3. robots.txt 可以制止搜索引擎对非公开页面的爬行与索引,如网站的后台程序、管理程序,事
实上,对于某些在运行中产生临时页面的网站来说,如果未配置robots.txt,搜索引擎甚至会
索引那些临时文件。
4. 对于内容丰富、存在很多页面的网站来说,配置robots.txt 的意义更为重大,因为很多时候
其会遭遇到搜索引擎Spider 给予网站的巨大压力:洪水般的Spider 访问,如果不加控制,甚
至会影响网站的正常访问。
5. 同样地,如果网站内存在重复内容,使用robots.txt 限制部分页面不被搜索引擎索引和收录,
可以避免网站受到搜索引擎关于 duplicate content 的惩罚,保证网站的排名不受影响。
robots.txt 带来的风险及解决:
1. 凡事有利必有弊,robots.txt 同时也带来了一定的风险:其也给攻击者指明了网站的目录结构
和私密数据所在的位置。虽然在Web 服务器的安全措施配置得当的前提下这不是一个严重
的问题,但毕竟降低了那些不怀好意者的攻击难度。
比如说,如果网站中的私密数据通过www.yourdomain.com/private/index.html 访问,那
么,在robots.txt 的设置可能如下:
User-agent: *
Disallow: /private/
这样,攻击者只需看一下robots.txt 即可知你要隐藏的内容在哪里,在浏览器中输入
yourdomain.com/private/... 便可访问我们不欲公开的内容。对这种情况,一般采取如下的
办法:
设置访问权限,对/private/中的内容实施密码保护,这样,攻击者便无从进入。
另一种办法是将缺省的目录主文件index.html 更名为其他,比如说abc-protect.html,这样,
该内容的地址即变成
yourdomain.com/private/abc-protect.htm...,同时,制作一个新的
index.html 文件,内容大致为「你没有权限访问此页」之类,这样,攻击者因不知实际的文
件名而无法访问私密内容。
2. 如果设置不对,将导致搜索引擎将索引的数据全部删除。
User-agent: *
Disallow: /
上述代码将禁止所有的搜索引擎索引数据。
参见:页面收录减少,如何检查判断?
网页相似度
网页相似度是比较网页是否相似,通常有以下两种计算方式:
1. 根据网页摘要来比较,如果多个网页摘要的md5 值一样,证明这些网页有很高的相似性
2. 根据网页出现关键词,按照词频排序,可以取N 个词频高的,如果md5 值一样,证明这些网页
有很高的相似性。
网页相似度对SEO 的影响:
Google 对网页相似度限制在60%,如果超过这个标准将导致页面不被收录,或者收录后排名靠后中。
参考:如何降低网页相似度?
404 页面
相关服务器返回代码介绍:
200 客户端请求已成功响应。
301 永久重定向某个链接。
302 临时重定向到某个链接。
404 访问的页面暂时不存在。
当网站进行调整、页面进行修改的时候,便会有网页被删除、改名或移动位置,这时候,虽然
相应内容的网页还存在于网站中,但使用原来的地址访问则无法访问,或者由于拼写错误导致一个
无效的链接,都将使服务器返回 404 状态码。
但是,Web 服务器默认的404 错误页面,均十分简陋、呆板且对用户不友好,无法给予用户寻
找相应信息的更多线索,用户看到这类页面往往最直接的反应并是关闭浏览器窗口离开,这在很大
程度上给网站造成损失。毕竟,对网站来说,用户永远是最重要的资源,以这种方式损失用户更意
味着某种程度的失败。
这也是许多网站使用自定义404 错误页面的原因。通过良好的自定义404 页面,可以包含对网
站的相应介绍、用户可能感兴趣的内容链接或者网站内容导航链接、内容搜索功能等,能够有效地
帮助访问者找到其欲寻找的内容或相似的内容,提高用户在网站内浏览更多信息的机会。
正确定义404 错误页面:
1. 对于已经存在的信息由于路径改变而导致访问不了时,应该在IIS 中定义404 错误指向一个动
态页面,在页面里面使用301 跳转到新的地址,此时服务器返回301 状态码。
2. 当访问一个错误的链接时,将调用404 页面,但由于在IIS 里面设置的不同将导致返回不同的
状态码:
1. 404 指向的是一个htm 文件,此时页面返回的404 状态码,这是正确的。
2. 404 指向的是一个URL,例如 /error.asp,如果不在页面里面进行设置,仅仅是返回提示
的HTML 代码,将导致页面返回200 状态码,此时的危害在于,当很多页面找不到时,
都返回和访问正常页面时返回一样的200 状态码,将使搜索引擎认为该链接存在,并以
错误页面的内容进行收录,当这样的链接很多时,将导致大量页面重复,使网站排名降
低。处理方法:在显示完提示内容后,增加语句: Response.Status="404 Not Found" ,
这样就保证页面返回404 状态码。
3. 避免在调用404 页面的时候返回302 状态码,容易被搜索引擎认为是重定向作弊。
4. 检测方法,使用HttpWatch 查看返回代码。参见:
在这个例子中,我请求的是http://www.sina.com.cn/1223.html ,新浪返回错误页面,然后5 秒
钟后,使用js跳转到首页。
内容优化
内容优化不仅可以提高关键词的排名,还可以吸引用户点击,最终使订单成交。
1. 搜索结果内容优化
在百度里面搜索:SEO培训
好的例子:
不好的例子:
总结:
A. 好的搜索结果内容是简洁、连贯的一段话,能够吸引用户点击,在排名相对较低的时候
(如第三、四名),能够获得超越排名位置的点击率。(国外点击率参考:排名第一:点
击率51%;排名第二:点击率16%;排名第三:点击率6%;排名第四:点击率6%。)
B. 搜索结果的内容出现在meta description 中,或者网页的正文中。
2. 网页内容优化
好的例子:Dell PowerEdge 1950 Server 详细信息
总结:
A. 内容页最好图文并茂,分类明确,让用户可以全面的了解该页面要表达的意思。
B. 页面能够让用户感觉到你的技术水平、工作态度。
3. 软文优化
1.初级软文:是指内容有一定的价值,站长在发布内容的时候,在尾部增加转载的来源网站,既
可以增加外链,当用户对文章感兴趣时,就会点击链接,这样又能给他的网站带来一些流量。
好的例子:ZBlog优化
2.高级软文:将网站所表达的含义,以全新的方式阐释,内容具有极高的价值,在讲到关键词的
时候,以实例的形式自然的加入网站的链接。
好的例子:格子经济
点评:这些文章不仅在短时间内给百万首页带来大量的流量,提高网站的知名度,与此同时也
达到了销售格子的作用。
总结:
A. 软文的内容一定要对用户有用,用户感觉好,才能帮助你传播转载。
B. 在文章中出现关键词的时候要替换成你要排名的页面,这样别人转载的时候,就帮你
做了大量的外链了。
C. 文章中不要出现很明显的联系方式等信息,否则会被当做广告贴而删除。
D. 不要在百度产品中发布,否则会导致网站遭屏蔽。
第六部分 搜索引擎优化的重点:链接策略
对于简单的关键词,只要做页面内部优化就可以排名上去,对难度大的关键词,就需要依靠链接策
略了。
导入链接
搜索引擎在决定一个网站的排名时,不仅要对网页内容和结构进行分析,还围绕网站的链接 展
开分析。对网站排名致关重要的影响因素是获得尽可能多的高质量外部链接,也称导入链接。
将导入链接纳入排名重要指标的依据在于,搜索引擎认为,如果你的网站富有价值,其它网 站
会提及你;对你提及越多,说明价值越大。由此引申出链接广度(Link Popularity)在搜索引擎优化
中的重要地位。
当然了,既然导入链接有这么大作用,人们想方设法地为网站「制造」外部链接,导致涌出大
量垃圾(spam)链接。这也就是以前优化就是在论坛发贴的原因。
搜索引擎目录:
全球最大的开放式目录库
dmoz.org...登录DMOZ 的好处:
1.由于 Google 等重要搜索引擎都采用 ODP 的数据库,所以一旦被收录,你的网站的PR 会很
快升值。
2.国内有很多人是复制DMOZ 的数据,相当于间接给你做链接,对提升PR 很有帮助。
不过DMOZ 是人工审核的,要求及其严格,曾经有人要花5000 元,就为了让人帮他,将他的网
站被DMOZ 收录。
例如:我的网站:非常软件网 ,提交后一周就被收录了。 收录后的PR值从0 升至3。
最近百度改版,有些信息就来自于DMOZ,所以加入DMOZ 好处多多。
参见:如何提交DMOZ?
付费登录:
例如:sohu搜狐 ,登录需要花费300-1000。
付费登录商业模式包括普通登录和固定排名,一般按年付费,网站在付费之后立即 登录目录,
无须等待和受到其它因素的影响。门户搜索引擎的搜索程序也比较偏重于对自身付费目录数据
的抓取。总体上,付费登录对于商业网站和采用了大量不利于搜索引擎友好的手段建设的网站
来说,还是有必要的。
高质量导入链接:
1.搜索引擎目录中的链接以及已加入目录的网站的链接。
加入搜索引擎目录,说明这个链接被搜索引擎认可。
2.与你的主题相关或互补的网站。
说明你的网站是专门做这方面的,比如电影网站链接电影网站。
3.PR 值不低于 4 的网站 。
PR 值为4 的网站很容易做到,但是PR>4 的网站很难了。百度的PR 才是7。
不过google 对英文网站更偏向一点,大部分英文网站的PR 值都大于中文的。
4.具有很少导出链接的网站。
导出链接只有5 个的网站比导出链接30 个的网站,对你的网站的加分贡献要高。
例如一个网站PR 值为10,有5 个外链的,每个可以分到2,比30 个就高多了。
5.内容质量高的网站 ,就是原创内容多的网站。
原创内容多的网站是搜索引擎最喜欢的,当然也算是高质量链接了。
垃圾链接:
对网站排名不起作用或起反作用:
1.留言簿、评论中大量发贴夹带网站链接。
例如:留言簿
2.已经加入太多导出链接的网站
例如:太多导出链接。
3.博客的引用。
例如:引用通告链接
4.加入链接基地,或使用程序与大量会员网站自动交换链接,被搜索引擎视为典型的垃圾链接,
极有可能受到惩罚或牵连。
两种导入链接被误认为可以增加链接广度:
1.点击付费的搜索引擎广告链接,如百度竞价排名和 Google 的右侧关键词广告。
例如:关键词广告 中Google广告。
2.放在Flash,或者js 脚本里面的链接。
由于搜索引擎搜索不到,当然就无法增加链接广度了。
获得高质量导入链接:
1.向搜索引擎目录提交网站。
2.在重要网站发表专业文章。
围绕目标关键词在一些重要站点发表文章,在文章中或结尾带上你的网站签名。这样也是既
可以获得高质量互惠链接,亦可能获得目标客户。重要网站有博客、行业内流量高,威信度
高的网站。
比如IT技术:zdnet,被他收录的文章会被很多人转载的,页面的PR将不会低于4 的。
3.在所在行业目录提交网站。
尽可能向更多的相关网络目录、行业目录、商务目录、黄页提交你的网站,加入企业库。
搜索的方法:目录网站 。
4.寻找网站交换链接。
参见:如何进行友情链接?
导出链接
导出链接就是你的网站中指向其它网站的链接。
搜索引擎机器人除了分析你的导入链接,也会分析你引出去的站点,如果导出链接站点内容与你的
网站主题相关联,同样有利于搜索引 擎友好。这也是交换链接要选择主题相关网站的原因。还有个
现象就是由于缺乏原创资料,他们常常转摘其它网站的文章作自己网站的内容,但又不注明来源,
惟恐导出链接助长了竞争对手,不利于自己的网站访问量。其实,对搜索引擎来说,适量、适当的
导出链接是很有必要的。
例如:墨攻剧情,这个页面是我采集新浪的,同时也注明了来源。
当然,一个页面的导出链接也不能太多, Google 认为一个页面的最大导出链接数量不应超过 100
个。
内部链接
一个站点的页面之间也往往彼此链接,如一篇文章结束后的「相关文章」 列表,将该网站中同一主题
下的其它文章都链接在内,不仅方便访问者,提高流量,也有利于搜索引擎索引网页,同时多个页
面链接同一个内页,有助于该内页的排名提高。
例如:内链演示中的相关商品。
网站还可以通过建立多个二级域名子站,子站间彼此相链,再一起链回主站,形成一个子站群包围
主站,对提高排名相当有利。
关键词链接文本及上下文语意
1.搜索引擎比较重视链接文本中出现的关键词。因此无论是导出链接、导入链接还是内部链接,都
最好兼顾到链接文本中含有关键字。
例如:浪潮服务器,每个链接都有关键词。
2.除了链接文本,链接周围的文字即上下文语意也非常重要。链接分析系统通过检 查链接上下文内
容来确定网站与其链接对像之间的关联度,以评估该页面的内容质量。
例如:买卖通利器 可以看到里面 很多关键词都增加了链接。
讲到这里不得不提一下 什么是Google炸弹,即利用此方法实现的。
链接的重要性
下面列出链接的重要性,在网站优化的过程中要引起重视:
1. 链接所在的位置,如果链接处于网页的内容位置,则权重高,处于像页脚那样的底部位置,则权
重低。
2. 链接文字的离散性,就是说,如果你的网站的外链全都整齐化一地使用同一种锚文字来描述,那
Google 就会怀疑这是人工做出来的链接,所以可能降权。
3. 链接的Title 属性,Google 会认为这也是相关的描述,但是这种对于用户可见性不好,相关性肯
定不如直接使用锚文字的高。
4. 链接超过一定的数量。可能不会被Google 搜索到,Google 官方举的例子是100 个,超过这个数
Google 的蜘蛛就「审美疲劳」了。
5. 链接所在的网站的IP 地址与指向目标相差越大,效果越好,如果是完全一样,那你很可能是同一
台服务器上的网站「近亲结婚」,Google 会歧视的哦。
6. 链接所在的页面如果出现与链接锚文字相同、相近的关键字,很好,会提高相关度。
7. 链接所在的页面如果出现在主题相关的网站中,很好,提高相关度。
8. 链接的稳定性,如果你的链接很不稳定,今天出现一万个,明天剩下几十个,那Google 就会注
意到了,你很可能在发垃圾链接哦。
9. 链接出现在权威网站,如:.edu 和.gov 这样的网站中,会提高权重。
10. 互惠链接会被极大的降权。
第七部分 搜索引擎优化作弊
SEO 作弊手段
关键字堆砌:
定义:为了增加某个词汇在网页上的出现频率,而故意重复它。例如在Title,Meta 中。
不好的例子:手机手机手机手机手机手机手机手机手机。
这是很低级的作弊手段,很容易被搜索引擎惩罚。
如果想增加关键词密度,应该这样:
例如手机。
IT 世界手机频道是中国最权威的手机内容网站.提供手机新闻、手机评测、手机拆卸、手机图赏、业
界动态、手机专题、掌上电脑、手机报价、手机行情、手机导购、手机技巧、手机下载、手机评测、
手机图片、手机大全、手机资料、手机饰物、手机论坛等等精彩。
Google 搜索手机:手机
虚假关键词:
定义:通过在META中设置与网站内容无关的关键词,如在Title中设置热门关键词,以达到误导用 户
进入网站的目的。
例如:通常这些网页没有内容,只有标题,内容也是标题的重复。
搜索引擎不宜发现,但如果你发现后提交Google,这个页面一定会被惩罚。
向 Google 举报作弊网站。
隐形文本/链接:
定义:为了增加关键字数量,网页中放一段与背景颜色相同的、包含密集关键字的文本,访客看不
到,可搜索引擎却能找到。类似方法还包括超小号文字、文字隐藏层等手段。隐形链接是在隐形文
本的基础上在其它页面添加指向目标优化页的行为。
表现形式:
<font style="font-size:1px;">搜索引擎优化</font>
<div style="display:none;">
搜索引擎优化
</div>
<font style="color:white;">搜索引擎优化</font>
这是很低级的作弊手段,很容易被搜索引擎惩罚。
重定向:
定义:使用META 刷新标记、CGI 程序、Java、Javas cript 或其它技术,当用户点击一个链接时,自
动跳到另一个网页。搜索引擎不宜发现,但如果你发现后提交Google,这个页面一定会被惩罚。
常用的重定向方法:
<html>
<head>
<%
'服务器端重定向
response.redirect "
http://www.sup....com/"
%>
<!-- 标签 -->
<meta http-equiv="refresh" content="10;URL=http://www.baidu.com/">
<!-- 脚本 -->
<script language="javascript">
location.href="
http://www.b....com";
</script>
</head>
<body>
<!-- 使用Flash -->
<object width="480" height="385">
<param name="movie" value="url.swf?url=http://www.baidu.com"></param>
<embed src="url.swf?url=http://www.baidu.com" type="application/x-shockwave-flash"
width="480" height="385"></embed>
</object>
</body>
</html>
复制站点或内容:
通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同
一页面进行多次索引的行为。镜象站点(Mirror Sites)是此中典型。
通常表现:一个网站有多个域名,多个域名都简单的指向同一个站点。
搜索引擎容易发现,通常会将网页降权。
解决这个问题:
1. IIS 里面演示配置。
2. 其他域名都指向一个包括以下内容的页面。
asp
Response.Status="301 Moved Permanently"
Response.AddHeader "Location", "
http://www.sup....com/"
Response.End
asp.net
Response.Status = "301 Moved Permanently";
Response.AddHeader("Location","
http://w.... supercss.com/」);
3. 在镜像服务器放置一个robots.txt 文件,并设置成拒绝所有蜘蛛索引。
User-agent: *
Disallow:/
隐形页面:
指同一个网址下对不同的访问者选择性返回不同的页面内,搜索引擎得到了高度优化的网 页内容,而
用户则看到不同的内容。
这是一种非常高级的作弊方式,通常用户和搜索引擎都发现不了。
代码:区别蜘蛛代码(ASP)
包含指向作弊网页的链接:
做友情链接时,链接到作弊的网站,特别是在首页链接到作弊网站,将导致网站连带被惩罚。
避免被牵连:
1. 经常性的检查首页友情链接网站是否被搜索引擎惩罚。
2. 将有风险的链接以脚本的方式显示。
例如:<a href=』http://www.supercss.com』>非常代码网</a>
修改成:document.write(「<a href=』http://www.supercss.com』>非常代码网</a>」);
3. 将友情链接放在Iframe 页面里面。
4. robots.txt ,禁止所有的搜索引擎访问这些目录。
User-agent: *
Disallow: /links/
5. 针对Google 使用标记说明该页面的链接被忽略:
<meta name="Robots" content="index,nofollow" > 页面全部链接都无效
<a rel=」nofollow」 > 六合彩 </a> 标记的这个链接无效
重复注册:
定义:在短时间内,将一个网页重复提交给同一个搜索引擎,其实,这种作法适得其反。
其实想让搜索引擎收录是很简单的。参见:如何让搜索引擎收录网站?
站点上加了恶意代码或者故意挂马:
现在搜索引擎能够分析出来,降低网页的信任度,并搜索结果里显示该警告提示。
例子:
参见:关于恶意软件警告:「该网站可能含有恶意软件,有可能会危害您的电脑。」
链接工厂:
「链接工厂」是这样一组网页,它们都与组中的其他网页相连。它故意这样设计,是为了在搜索引擎
的结果中提高排名。
搜索引擎对作弊的处罚
搜索引擎的惩罚会根据所犯的错误而定,具体显示现象:
1. 关键词排名降低。
2. 长时间不更新网页内容。
3. 收录减少,甚至为0。
4. 网站PR 值成0。
发现网站被屏蔽后,应查找网站被屏蔽的原因,修改后,向搜索引擎提交申请,请求再次收录:
1. Google
要申请重新加入,请登录 Google Sitemap,选择"申请重新加入"链接,然后按照所示步骤操作。
权威指南:http://www.google.com/support/webmasters/bin/answer.py?answer=35843
2. 百度
首先请确认您的网站上已经没有作弊行为,然后请到百度登录吧或发送邮件到
spam@baidu.com,
按照下面的内容进行说明,一般在一个月后可以被解除。
您应在申请解除惩罚的邮件中说明以下内容:
请说明您的网站地址
请说明您什么时间发现网站在百度消失的?
请说明您确认使用了何种被百度确认的作弊方法?
好的例子:
百度申请撤销信样例:
尊敬的百度客服:
您好!
首先我自我介绍一下,我是时尚Q 族
lm5588.com... 的站长,我叫自由幻想,我的网站建
立于06 年的10 月份,最近因为种种原因我把网站上的程序换了一下以后,百度的收录就成0
页,我不知道为什么会这样的,我一直按照百度搜索引擎的里面协议规定的去做的,没有作弊
也没有违反你们的规定,麻烦尊敬客服帮我重新收录一下,非常感谢你们辛勤的工作,最后我
祝百度越办越好!!
自由幻想
2007 年7 月5 日
这位网页在信发出1 周后,域名被恢复,现在收录达1180 页。
3. 对于无法恢复的域名,最好的办法就是重新注册新的域名。
第八部分 Google 搜索引擎
Google PageRank
概述:
PR 值,即网页级别
Google 对网页级别的描述 :「作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大
的链接结构。实质上, 当从网页 A 链接到网页 B 时,Google 就认为「网页 A 投了网页 B 一票」。
Google 根据网 页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,
Google 还 要分析投票的网页。「重要」的网页所投出的票就会有更高的权重,并且有助于提高其它
网页 的「重要性」。
PR 值算法原理:
一个网页被多次引用,则它可能是很重要的;
一个网页虽然没有被多次引用,但是被重要的网页引用,则它也可能是很重要的;
一个网页的重要性被平均的传递到它所引用的网页。这种重要的网页称为权威网页。
参见:怎样查自己网站的反向链接?
影响 PR 值的因素:
1. 网站的导入链接质量。导入链接越多质量越高,该页面的PR 值就越高。
2. 导出链接数量。导出的越少,导出的链接获得的PR 值就越高。
反例:http://www.soft6.com/inc/link.shtml 导出链接过多。
3. 搜索引擎收录一个网站的页面数量。数量越多,内部链接就越多。
4. 首页PR的高低。
首页是推广的核心页面,所以网站首页PR 高低对内页各PR 也产生直接影响。
首页>一级页面>二级页面>三级页面……每深入一级,PR 降低1 -2 个档次。
5. PR 值的更新:
Google 每个月进行一次彻底的数据更新,更新后的网站排名和导入链接都会有某 些变化,但其 PR
更新时间一般要延迟至 数据更新后三个月左右,而且网站的 PR 值相对稳定, 要上升或下降一级
PR 是很不容易的事情。
PR 值的作用:
1.网页比较重要,拥有了排名靠前的优先权。
2.具有了获得高质量导入链接的谈判优势。
3.搜索引擎会加快对网页数据的更新。
Google Dance
概述:
.Google Dance ,即Google 数据更新。
Google 有 8 个数据中心,共享超过一万台的服务器。一般在每月15-20 号左右升级数据库库。
期间,新的网站被加入,无效网站被删除,对收录网站进行全面深度检索,也可能在这期间调整算
法。由于每次升级都会引起很多网站排名波动,俗称 Google Dance。
Google Dance 对于 SEO 来说,涉及的注意事项如下:
1.网站的提交及更新时间。
在 Dance 期间,新网站被收录的机会增大,因此宜在 Dance 其间提交新网站及加大网站更新力度。
查看多服务器PR值
2.静观其变,及时跟进 。
由于数据调整有一个过程,Dance 期间的普遍表现是排名波动不稳定,忽上忽下,也可能在这期 间
调整排名算法。所以在 Dance 结束后,针对排名升降结果和竞争对手的排名情况调整自己的优化策
略。
Google SandBox
关于Google 沙盒现象,业界众说纷纭。
一种观点:这是Google 对于那些刚发布不久就有良好排名的「可疑」站点置于某种屏蔽程序中进行
一段时期的「隔离审查」。待网站 表现稳定之后,再解除屏蔽,给予其应得的实际排名和PR 值。
这段时长可能延续3 个月左右。
当然,还有一种观点认为:Google 为了在搜索结果(SERP)中为用户提供更多新信息,往往给予新
发布的网站更多「关照」,使得新网站暂时获得排名优势;但随着Google 数据更新不断加快,这种
对新网站的照顾开始解除,于是该网站排名趋向正常。
无论原因怎样,对待沙盒效应,正确的态度和方法是:保持冷静,当排名在短时间内迅速上 升时不
应盲目乐观,因为这是不稳定的表现。应该利用这个有利时机,频繁更新网站内容, 提高内容质量,
获得更多高质量导入链接,增加网站访问量,才能将排名优势一直保持下去。
Google 网页搜索
1. Google 相关词自动提示,不但使你更快的找到需要的关键词,同时也可以获得一个词的相关关
键词。
2. 为网站申请加入 Google 资讯,这样可以使你的网站能够在google 结果里面以特殊的方式显
示,获得用户更多的点击,参见:
在Google搜索自行车关键词。
3. 为一个关键词做多个推广页面,让这几个关键词页面都排名在google 搜索结果的同一页,就会
出现折叠的显示效果,吸引用户更多的点击。
在Google搜索 浪潮服务器报价 关键词。
4. 重视对Google 图片的优化,因为在网页搜索里面也可能出现图片。
以上三个图片是在图片搜索里面排名在前三个的图片。汽车标志
在Google 图片搜索汽车标志关键词。
5. 时常要对网站进行检查,避免网站被挂木马,否则将严重影响用户点击。
在Google上搜索 搞笑视频 关键词。
参见:关于恶意软件警告:「该网站可能含有恶意软件,有可能会危害您的电脑。」
6. 努力让你的网站成为Google 上的知名网站,在搜索结果中将以不同的方式显示。
在Google 上搜索 腾讯 关键词。
7. 在Google 做竞价广告,可以让更多的人找到你。
申请 Google Adwords发布广告。
Google Adsense
Google Adsense 是我目前遇到的收入最高的广告系统,希望大家通过Google Adsense 盈利。注册地
址:https://www.google.com/adsense/login/zh_CN/
广告分类:
广告单元:每页可最多添加三个广告单元。收入方式:对网站上广告的有效点击次数和展示次
数都会带来收入。
链接单元:除网页中现有的三个 AdSense 广告单元外,每页中可放入一个链接单元。收入方式:用
户点击链接进入广告主题页面,再次点击广告链接才能获得收入。
搜索单元:每页最多可放置2 个Google AdSense for search 框。在网站上加入 AdSense for search 框
后,用户点击搜索结果页上的广告时您就会获得收入。
推介:每个推介产品或服务放置最多 2 个推介单元。
Google Adsense 推荐收入:如果通过您的推介注册 Google AdSense 的发布商在注册后的 180 天内
获得了 US$5.00 的收入,我们就会向您支付 US$5.00。如果该发布商在注册后的 180 天内获得了
US$100.00 的收入,而且具备接受付款的资格,我们就会向您额外支付 US$250.00。如果在任意 180
天的周期内,您推介了 20 位发布商,且这些发布商都获得了超过 US$100.00 的收入并且均具备接
受付款的资格,您将会获得 US$2,000.00 的奖金。
Google AdWords 推荐收入:如果通过您的推介注册 Google AdWords 的广告客户在注册后的 90 天
内花费了 US$5.00 (不包括 US$5.00 的注册费用),我们就会向您支付 US$5.00。如果该广告客户在
注册后的 90 天内花费的金额达到 US$100.00,我们就会向您额外支付 US$40.00。如果在任意 180
天的周期内,您推介了 20 位广告客户,且这些客户各自在其注册后的 90 天内花费了超过
US$100.00 的费用,您将会获得 US$600.00 的奖金。
带有 Google 工具栏的 Firefox:当您推介使用带有 Google 工具栏的 Firefox 的用户首次运行
Firefox 时,您可以获得最高 $1 美元的收入,具体金额依您所在的位置而定。您的推介对像应为从
未安装过 Firefox 的 Windows 用户,只有这样您才可以获得该收入。
广告代码格式:
<script type="text/javascript"><!--
google_ad_client = "pub-xxxx"; // 你的用户代码
google_ad_output = "textlink";
google_ad_format = "ref_text";
google_cpa_choice = "CAAQqcu1_wEaCMVXofsEbjfHKOm84YcBMAA";
google_ad_channel = "";
//-->
</script>
<script type="text/javascript" src="
http://pagead2.googlesyndicati.../show_ads.js">
</script> <!- 引用的网页文件