浅谈SEO

Published in Nov-21-2018


写这篇文章,主要是记录一下自己从自学SEO到建站实践的过程中遇到过的一些问题和总结出来的一些知识,还有一些零零散散的东西,怕哪天突然进不起来,写个文章记录一下,权当总结和笔记~

  

浅析SEO

“搜索引擎优化”,对其形象化的话,就是搜索(用户)引擎、(谷歌百度360)、优化(企业SEOer),SEOer一定是要将用户放在第一位,企业最赖以生存的永远都是消费者(用户),其次才是引擎,就是很多人提到的“用户体验”要放在优化的第一位,虽然很多的工作都是在讨好搜索引擎,如“图片的alt”“301跳转”“404页面”但其实那些工作只是为了让网站更好得迎合一个搜索引擎(平台)的标准和规则罢了,真正意义上的优化是在如何提高“用户体验”这一步。如“网站打开速度”“产品或文章质量”“网站外观布局”等等~


学习SEO

首先要坚定“不懂就谷歌(百度)”的信念,在接触一样新事物的时候,难免会遇到一些陌生的专业名词,如“沙盒”、“爬虫”、“伪静态”等,不要直接跳过,一定要去查去问,理解透彻,逐个击破。网上不乏一些自学网站,最好是挑选一个有序得从浅到深,从入门知识开始学习,把一些基础理论弄清楚,如最基础的title、keyword、description、权重、外链、快照等,每个词都理解透彻。之后再到实践,学习SEO最最最最重要的一定一定是实践,因为在实践的过程中会遇到很多问题,解决问题是最好的学习和积累过程~


权重

有流量就有权重吗?不,不是有流量就有权重,而是有“预计流量”才有权重。

什么是预计流量?预计流量通过某个词的百度指数和排名得出的一个预估值。如“老曹”的百度指数是130,该词排名第一的网站就会得到130左右的预计流量,排名第二第三可能会有100、80的预计流量,排名第十页的可能就为0。(注:!!无论网站是否部署该关键词,只要网站通过该词搜索有排名即可。)SO,就算网站每天有一百几十的流量,没有预计流量还是没有权重的。有的关键词可能每天有不少人搜索,可能也是没有“指数”的。为什么?因为百度要挣钱,你可以买这个词让它有指数。


伪静态

网页链接有分静态链接和动态链接,搜索引擎对静态链接相对友好,但是静态链接对空间资源浪费较大,所以很多网站程序都是使用动态链接。网页链接中含有“?”或者以“ASP”“PHP”“JSP”等结尾的基本都是动态页面。但是静态链接优化较好也相对美观,所以就产出了“伪静态”,就是将动态链接伪装成静态链接,如:www.xxx.com?xxx.php  伪装成www.caotongxue.cn/article/seo 。


百度算法

百度算法是百度为防止网站作弊而推出的一些算法规则,在网站优化的过程中必须遵循算法规则,否则将会受到严惩。

绿萝算法:打击网站买卖外链、低劣超链,处理垃圾外链

石榴算法:打击网站含有大量低质弹窗广告及大量混淆页面主体内容等垃圾广告的页面。

清风算法:打击网站标题作弊,主要指标题内容虚假,或在标题中故意堆砌关键词等行为。标题内容虚假,指标题表述的内容与网页内容不相符,有欺骗用户嫌疑。标题故意堆砌,指在标题中多次重复、过度堆砌关键词。

惊雷算法:打击恶意刷网站流量来提高网站排名的行为,包括人为恶意点击和软件代刷点击。

飓风算法:打击采集网站、镜像网站和一些网页内容重复,原创质量低的网站。


robot.txt

robots.txt是一个纯文本文件,是搜索引擎中访问网站的时候要查看的第一个文件。robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。每个站点最好建立一个robots.txt文件,对seo更友好。每当搜索蜘蛛来寻找并不存在的robots.txt文件时,服务器将在日志中记录一条404错误,所以你应该在网站中添加一个robots.txt(即使这个robots.txt文件只是一个空文件)。

User-agent: 该项的值用于描述搜索引擎蜘蛛的名字。如果该项的值设为*,则该协议对任何机器人均有效。

Disallow: 该项的值用于描述不希望被访问到的一个URL,一个目录或者整个网站。以Disallow 开头的URL 均不会被搜索引擎蜘蛛访问到。任何一条Disallow 记录为空,说明该网站的所有部分都允许被访问。

网站目录下所有文件均能被所有搜索引擎蜘蛛访问

  User-agent: *

  Disallow:


禁止所有搜索引擎蜘蛛访问网站的任何部分

  User-agent: *

  Disallow: /


禁止所有的搜索引擎蜘蛛访问网站的几个目录

禁止搜索引擎蜘蛛访问目录a和目录b

  User-agent: *

  Disallow: /a/

  Disallow: /b/


只允许某个搜索引擎蜘蛛访问

  User-agent: Googlebot

  Disallow:

  

网站日志

网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以·log结尾的文件,确切的讲,应该是服务器日志。网站日志最大的意义是记录网站运营中比如空间的运营情况,被访问请求的记录。通过网站日志可以清楚的得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功。

老曹.png

  

nofollw

nofollow 是HTML页面中a标签的属性值。这个标签的意义是告诉搜索引擎"不要追踪此网页上的链接或不要追踪此特定链接"。简单的说就是防止权重输出到目标链接上,有集中网页权重的作用,多数用于“网站内链”“网站外链”、“垃圾评论、留言”、“友情链接”等。对于一些中小网站或博客网站来说nofollow的作用并不大,但对于内容更新频繁且数量较大的资讯型网站来说还是很有帮助的。个人建议博客网站的友情链接不要用nofollow,毕竟本身作用不是很大,又伤感情,得不偿失~







评论区