相关文章
ASP.NET的SEO:使用.ashx文件——排除重复内容
2024-11-10 17:23

ASP.NET的SEO:使用.ashx文件——排除重复内容

本系列目录

 

不同的链接指向的页面如果具有大量相同的内容,这种现象就会被称为“重复内容”,如果一个网站的重复内容很多,搜索引擎就会认为这个网站的价值不高。所以我们应尽量避免各种重复内容。

动态网站的重复内容常常是由URL参数引起的,而URL重写会恶化这一现象(比较耐人寻味哟,呵呵)。因为如果使用的是原始的URL参数的话,搜索引擎可能会进行适当的判断,而得知重复内容是由URL参数引起的,自动的进行相应的处理;而URL重写会掩盖URL参数,反而使得搜索引擎无法识别URL参数。比如:这些URL所指向的页面内容其实是一样的,都是id=231的那篇文章,但这篇文章被blog和news两个栏目所引用,出于各种原因的考虑,我们最终的URL还是如上所示。处理的办法有两种,一种是利用机器人(robot)协议“排除”其中一个,另一种是通过301将其中一个URL永久重定向另一个URL。今天我们先讲robot协议。简单的讲,robot指的就是搜索引擎,针对Google,我们又将其称之为“蜘蛛(spider)”。蜘蛛是很有礼貌的,在抓取你的网页内容的之前,会首先征求你的意见。而你和robot之前就基于robot协议进行沟通。具体到实现,有两种方式:

1. 将一个的robots.txt文本添加到网站根目录下,如:

#行表示注释;User-agent指搜索引擎,*表示针对所有搜索引擎,也可以指定具体的搜索引擎,如User-agent: googlebot;Disallow指定不允许访问的目录或页面,注意:1. 此文本是大小写敏感的;2.必须以“”开头,表示网站根目录; 和本系列的宗旨一样,我们着重谈ASP.NET技术。所以更多的robots.txt文本的注意事项,请查看http://www.googlechinawebmaster.com/2008/03/robotstxt.html但我们怎么动态的生成这个文件呢(这种需求其实蛮多的)?可能我们马上想到的就是I/O操作,在根目录下写一个txt文件……,但其实还可以有一种方法:使用一般处理程序(.ashx文件),代码如下:

一般处理程序实现了IHttpHandler,在前面UrlRewrite部分中,我们讲到了HttpModule,其实在ASP.NET的应用程序生命周期中,有一个称之为“管道(pipeline)”的概念:一个HTTP请求,经过一个有一个的HttpModule的“过滤/处理”,最终到达一个HttpHandle的“处理器”部分,HttpModule和HttpHandle就组成了一个“管道”,非常形象哟,呵呵。贴张图吧:

 

如果你对它还比较陌生的话,查看Page的源代码,你会发现,Page也实现了IHttpHandler,所以*.aspx文件是最常用的HttpHandle。但Page不仅仅是一个HttpHandler,它还嵌入了复杂的页面生命周期事件,所以从节约资源的角度考虑,很多时候我也可以使用自定义的、更轻量级的*.ashx文件(),来完成一些简单的工作。和生成一个txt文件类似,我们还可以生成验证码(jpg文件),xml文件等。然后还要做的一件事就是进行URLRewrite:

 

这样,蜘蛛就会以为在网站的根目录下的确存在一个robots.txt文件。

2. 在需要屏蔽的页面meta标签里加上<meta id="meta" name="robots" content="noindex,nofollow" />noindex 意味着该页面不能被索引nofollow 意味着该页面不能被“跟随”(将在SEO Hack中详细讲解)这是静态页面的效果,如果需要动态生成,也相当简单:meta中还可以指定description、keyword等,其技术实现是相同的。那么,两种方式我们如何选择呢?我的一些建议:1. 尽量使用robots.txt,这既能降低网站的负载(虽然很小,呵呵),因为蜘蛛查看了robots.txt文件之后,就不会再请求被屏蔽的相关页面了;而如果使用meta方式,蜘蛛必须先请求该页面,再做出不检索的判断,这时Http请求已经发出了,服务器端的资源就已经浪费了;另外,如果过多的meta屏蔽,也会使蜘蛛对网站产生不佳的印象,减少或放弃该网站的检索收录;2. robots.txt文本的匹配时从左到右的,这里就没什么正则匹配了!所以有的时候,我们不得不使用meta方式了。如我们文章开始的URL:http://www.freeflying.com/blog/231.htmlhttp://www.freeflying.com/news/231.html最后,再讲一些注意事项:1. 不要在所有页面使用相同的Keyword和Discription,这是我们很容易犯的一个错误,虽然articles.aspx是一个页面,但加上url参数后,就变成了成千上万个页面,如果你在页面上写死了Keyword和Discription,那将使这成千上万个页面都是一样的Keyword和Discription!2. 尽量避免使用基于URL的SessionID。ASP.NET在客户端禁用cookie的情况下,可以设置使用基于URL的SessionID,效果类似:
    以上就是本篇文章【ASP.NET的SEO:使用.ashx文件——排除重复内容】的全部内容了,欢迎阅览 ! 文章地址:http://sjzytwl.xhstdz.com/news/2289.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://sjzytwl.xhstdz.com/mobile/ , 查看更多   
最新文章
苹果不会再推出小屏手机,只能寄希望于苹果小折叠
2025年3月,彭博社记者马克·古尔曼透露,苹果正式终结小屏iPhone产品线,未来两年内不会推出屏幕小于6英寸的机型。这一决策源于
东莞莞城城管践行雷锋精神,为垃圾分类“添翼”
为弘扬和践行雷锋精神,倡导绿色文明新风尚,3月5日,东莞莞城城管分局以“学雷锋纪念日”为契机,联合罗沙社区、东莞玉兰女子城
提额延期齐上阵!银行发力消费贷 需增强消费信贷可持续性
近期,多家银行密集跟进政策举措,推出相应消费贷产品。不少银行消费贷额度有所提高、期限有所延长,同时利率持续降低。有权威专
聚焦“百千万工程”丨“乡村艺先生”将走进全市973个村(社区)
近日,根据市委宣传部关于在全市开展“艺起乡见‘百千万’”系列活动的工作安排,云浮市、云安区两级文联率先行动,在云安区高村
刀郎演唱会即将开唱,交通出行攻略全掌握
湖北日报全媒记者 杨然 通讯员 武焦萱3月29日、30日(周六、周日),山歌响起的地方·刀郎2025巡回演唱会武汉站将在武汉体育中心
速腾聚创发布AC1及AI-Ready生态 提供机器人一站式解决方案
器人之眼 Active Camera 首款产品AC1雷递网 乐天 3月28日速腾聚创今日发布机器人视觉全新品类Active Camera的首款产品AC1及AI-Re
对话星纪魅族COO廖清红:AI要平权,手机是AI Device最大的终端
在AI大模型的推动下,消费电子产业正在新一轮的变革中。在这之中,作为业内第一批喊出“All in AI”口号的品牌,星纪魅族以Flyme
已趋成熟的电机控制技术还将如何变化?——效率、安全与智能
芝能智芯出品近期英飞凌的工程师做了一个讲座《Changes In Motor Control》电机控制技术作为一项历经数十年发展的成熟技术,已广
连续第二年实现盈利,没有私有化的复宏汉霖会更有奔头吗?
文 | 医药研究社私有化折戟的,没有辜负股东的期待。业绩增长的可持续性,还是让投资市场看到了复宏汉霖的前路依然光明。据最新
关于开展2025年个人信息保护系列专项行动的公告
《中华人民共和国个人信息保护法》施行以来,中央网信办会同有关部门持续组织开展个人信息保护相关工作,建立健全工作机制,研究