如何生产和管理千万级页面

写一些做喜马拉雅seo是如何处理千万级页面内容。

做seo都说内容为王,确实,搜索流量来源于关键词,关键词来源于内容。

喜马拉雅seo项目定位于千万收录量、日几十万级别uv,从seo角度来说下面两种能力是“根”:

1、优质内容生产能力;
 2、个性化内容管理能力;

一、对于内容生产能力,主要由以下策略解决:

第一种、批量移植现有内容

批量挖掘、批量采集、批量发布互联网上已经存在的内容;

第二种、大力推进创造ugc内容

从产品着手促进用户自主产生内容,包括促进自助聚合内容、自主更新内容;

第三种:自然聚合现有内容

让已有的采集内容、ugc内容在自然的条件下进行组合、聚合、重组;

第四种:对自然生产无效内容进行重组,使之成为有效内容

比如:类似这种移动端为主的产品,一次性用户比例很高。从web角度来说,有利:批量生产页面;有弊:都是无效页面。

那么怎样变废为宝?对内容进行合理化重组很管用。

二、对于个性化内容的管理能力,主要由程序和人工结合解决。

庞大一个问题排在面前,数千万页面,如何管理,如何把有价值的页面以良好的姿态展现给蜘蛛?

我们没办法一个个去定义、去修改。这里推荐了解一个技术大牛常使用的宝贝:正则表达式

是的,思路上学习正则表达式,以一定的规则去处理批量数据;

第一步、提取关键信息;

第二步、设定好基础规则;

第三步、对规则进行分组;

第四步、设定规则生效范围、优先级;

所以,如果你了解正则是如何运行,就能很轻松做好规则系统设计,那么处理千万级数据也是游刃有余了。

============================

下面给出简单案例:

喜马拉雅title管理规则系统配置-逻辑

———————————-自定义配置↓↓↓
首页:
Title需要的字段:自定义
keywords: 自定义
Description:需要的字段:{分类名},自定义

分类页面:
Title需要的字段:{分类名},自定义
keywords: 自定义
Description:需要的字段:{分类名},自定义

———————————-全局配置↓↓↓
专辑详情页:
Title需要的字段:{专辑名},自定义
keywords: 自定义
Description:需要的字段:
{简介:提取40个汉字},{专辑名},自定义

领域详情页:
Title需要的字段:{领域名},自定义
keywords: 自定义
Description:需要的字段:
{简介:提取40个汉字},{领域名},自定义

个人详情页:
Title需要的字段:{用户名},自定义
keywords: {用户名},自定义
Description:需要的字段:
{简介:提取40个汉字},{用户名},自定义

声音详情页:
Title需要的字段:{标题},{所属专辑} ,{所属分类} ,{作者名} ,{上传者用户名},自定义
keywords: {领域} ,{继承上级分类设定的关键词}
Description:需要的字段:
{简介:提取40个汉字},{所属领域名},{所属专辑名},{所属分类名},{作者名},{上传者用户名},自定义

———————————-
Title:显示30个汉字
Des:显示80个汉字

分类的标题:根据关键词组合(自定义)
专辑的标题:目标关键词(相对热门的词)

详情页的标题:7到20字之间
详情页的简介:50个汉字以上

============================

具体内容组合实例,请参照喜马拉雅网站线上版:

http://www.ximalaya.com/

============================

转载随意~:陶醉 » 如何生产和管理千万级页面

赞 (73)
分享到:更多 ()