零点看书

字:
关灯 护眼
零点看书 > 重生87:开局截胡港岛女神 > 第1765章 遇到问题,分析问题,解决问题

第1765章 遇到问题,分析问题,解决问题

第1765章 遇到问题,分析问题,解决问题 (第2/2页)

第二,迭代可以分批进行,不需要一次性算完。
  
  第三,分数不需要精确到小数点后很多位,整数就行。”
  
  贾瀞雯把这些记下来,转告给团队。
  
  李明听了,一拍大腿:“对啊!我们可以分块计算!先把网页按链接关系分组,组内迭代,组间再迭代。
  
  这样内存占用能降下来。”
  
  思路打开了,进展就快了。
  
  第一周结束时,他们做出了简化版的超链分析算法。
  
  测试数据很小,只有一千个网页,但结果令人鼓舞——重要网页的分数确实高,垃圾网页的分数确实低。
  
  第二周,开始集成到真实数据里。
  
  问题又来了:十万网页的链接关系太复杂,计算一次要八个小时。
  
  “太慢了。”张涛盯着屏幕,“如果每天都要重新计算,根本跟不上网页更新的速度。”
  
  贾瀞雯给陈浩打电话。
  
  这次陈浩的建议很直接:“增量更新。
  
  每天只计算新增网页和发生变化的部分,其他的用缓存。”
  
  又是新的挑战。
  
  但团队已经适应了这种节奏——遇到问题,分析问题,解决问题。
  
  第二周周四晚上,李明从座位上跳起来。
  
  “出来了!第一次完整计算完成!”
  
  所有人围过去。
  
  屏幕上显示着计算结果:十万网页,每个都有一个分数。
  
  排在前面的,确实是那些权威网站,新闻门户,高校主页。
  
  排在后面的,大多是个人主页或者广告页面。
  
  “集成到排名算法里测试一下。”贾瀞雯说。
  
  李明敲了几行代码,启动测试程序。
  
  输入几个关键词,搜索结果按新算法排序。
  
  效果明显。
  
  之前搜“电脑价格”,前排结果里总有几个堆关键词的垃圾页面。
  
  现在那些页面不见了,取而代之的是真正的电脑报价网站。
  
  “准确率!”张涛喊,“测试集准确率升到百分之六十二了!”
  
  办公室响起掌声。
  
  连续两周的加班,值了。
  
  周五,贾瀞雯让大家休息一天。
  
  她自己没休息,去了中关村的一栋写字楼。
  
  公司该换个地方了。
  
  现在那个八十平米的办公室,六个人已经挤得不行。
  
  随着超链分析的实现,团队还要招人,需要更大空间。
  
  她看中了一间两百平的办公室,在五楼,视野不错。
  
  租金不便宜,但还能承受。
  
  签完租约,她开始联系装修。
  
  简单装修,隔出办公区、会议室、休息区,还要有个小厨房。
  
  同时,招聘启事也发出去了。
  
  这次她要招十五个人:算法工程师、前端开发、系统架构师、还有产品和运营。
  
  简历像雪片一样飞来。
  
  百度公测后的知名度,加上中关村的地理位置,吸引了很多求职者。
  
  贾瀞雯亲自面试了每一个技术岗位。
  
  她问的问题很实际:你怎么理解搜索?如果让你优化排名算法,你会怎么做?中文分词最大的难点是什么?
  
  有的候选人答得好,有的答得一般。
  
  她最终录用了十五个人,加上原来的五个,团队扩充到二十人。
  
  【跪求礼物,免费的为爱发电也行!】
『加入书签,方便阅读』
热门推荐
极品全能学生 凌天战尊 御用兵王 帝霸 开局奖励一亿条命 大融合系统 冷情帝少,轻轻亲 妖龙古帝 宠妃难为:皇上,娘娘今晚不侍寝 仙王的日常生活