找回密码
 加入SEO研究中心

QQ登录

只需一步,快速开始

搜索
  • TA的每日心情
    奋斗
    2020-2-29 20:54
  • 签到天数: 20 天

    [LV.4]偶尔看看III

    4

    主题

    40

    帖子

    3

    威望

    VIP会员

    关于网页去重,页面特征码定位!

    95 1
    2019-11-3 14:39:02
    显示全部楼层
    5学习币
    关于网页去重,页面字符的特征码是怎么来截取生成特征码的,因为我的内容是考试题库,不适合做伪原创,昨天查了些资料,好像说是一句话的开头部分还有【。】前后截取到多字符来定义页面特征码,希望无忧老师给个正确详细的答案。

  • TA的每日心情
    擦汗
    昨天 15:15
  • 签到天数: 304 天

    [LV.8]以坛为家I

    1218

    主题

    3108

    帖子

    262

    威望

    管理员

    管理员论坛荣誉勋章官方SEO讲师安全认证爱心达人论坛元老

    2019-11-3 19:59:48
    显示全部楼层
    要了解关于内容去重之前先建议你查看一下百度的两个算法专利。

    CN201110031636-一种网页重复的判断系统及其判断方法
    CN201410324553-重复网页识别方法和装置

    百度专利下载:
    CN201110031636-一种网页重复的判断系统及其判断方法.pdf (573.27 KB, 下载次数: 20)
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 加入SEO研究中心