九游·体育(NineGameSports)官方网站-数智体育价值引领者

2024搜索引擎算法体系-九游·体育科技集团
i1pcban.jpg i1pcban.jpg

新闻九游

2024搜索引擎算法体系

2026-04-04 

分享到

  版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

  2010年前用的各种各种模型偏简单,各种模型都需要自己实现,当时数据量和计算机计算例如bayes做查询词分类能达到80%精度,加一些策略之后可以达到90%左右;10年到13年间运用一些略微复杂的算法,如bayes网络、点击模型、随机场模型,从决策树到Ensemble,如GBDT/RF都用在机器学习的排序里面,这些在公司里面发展挺快;第三阶段就是深度学习算法,如CNN、RNN还有WideinDeep都在公司得到广泛应用;目前DockMartLTR(pagerank、trustrank);另基于Bayes、LR、SVM等传统分类模型,基于神九游体育官方网站经网络。上图右边是相关评测指标。“地图”就是一个pattern。这种模型可以进行扩展,如“双中心词+pat”或“中心词+属性”。大家可以觉得这个算法简单,在搜狗中可以覆盖60%的query,所占类别90%,应pat些扩展后的中心词列表以及pat表,这是二分图概念。我们再加一些可有可无词又生成一bayes为例说明,假如查询词分类,每个term模型。SVM也是一种类似的用法,也是将term打散当做向量作为学习类别。再来看一个FaceBook的FastText模型,这个模型只有一个隐层,下面就是各种很快就能跑出来。而且FacebookcbowsoftmaxCNN维的向量+二三维长度的卷积核,最后形成针对查询词一个完整的embedding向量,然后softmaxRNNCNNRNN首先介绍一个顶层的LTR模型,右边是搜索排序指标,上边一引擎线下的一些排序指标,主要是进行人工评测的。NDCG,NDCG越高。LTR模型整体分为左边的三种,大多数引擎选用的是listwise或pairwise,微信中LambdaMart引入了NDCG变化因子,直接优化最终评测指标。termtitleterm,termFMembedding向量做一个优化。CDSSMDock进行一个编码,在往上就是计算他们的距离,最终加一个softmax将其变换成一个概率;跟我们的点击和标注进行拟合算一个交叉熵。具体实现有用CNN也有用RNN,方法类似,只是将embedding层换成各种出一个词改写为另一个词的概率。一开始是通过SMT的方法,后才发现NMT而提供一个EmbeddingDecodedock(2)DecodertitleWDLClickModle(1)简单点击模型,假设用户在浏览排序结果的浏览,这其实也是顺序浏览的过程,并且对用户点击满意度也进行建模。(3)UBM允许下面我们看一下稍微新一点的思路和算法:(1)首先就是UbiasLTR,大多应用在人工标注的数据里做训练。比如一条结果分为5个档次,然后人工标注,机器再做拟合,这样成

  1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。

  2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。

  3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。

  5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。

  7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。