聂拉木| 泗水| 新和| 池州| 灵川| 祁县| 黄岩| 阜康| br88ap 88bf娱乐 银川| 3344444.com 宁德| 永平| 盈江| weide 麻阳| 宣城| 赣榆| 1946伟德 西盟| 休宁| br88 六合| betway88 ca88官网 阳新| dafa888 通河| 勐海| 门源| 武强| 冠亚pt 狗万ManBetX 万盛| 新津| 云龙| 万博体育论坛 通江| 若羌| 林周| 泽库| 台安| 松潘| br88 鹤峰| 敖汉旗| uedbet娱乐 betway88 宣恩| 陈仓| 义马| 吉安县| 新巴尔虎右旗| 大发手游上分 淮安| dafabet手机娱乐版 金门| 准格尔旗| dafa888娱乐场 澄迈| fun88 韦德1946 李沧| 漳平| 大荔| 康定| w88.com 本溪满族自治县| 白碱滩| br88 万博体育app 白沙| 松桃| 红河| 冠亚1.85 邛崃| 大埔| 遂昌| 万博体育贴吧 manbet娱乐 平遥| 泰和| 嘉峪关| 威海| dafa888 大奖网 海林| 高阳| 峨眉山| 太康| 定陶| 井陉| 土默特左旗| 赣榆| 长岭| 化隆| 沂水| 万博app进不去 罗江| 乐昌| 西宁| 阜阳| 宽甸| 武威| 威县| 惠州| opebet官网 额敏| 亚洲城贵宾最新网页版 乌什| dafabet真钱娱乐手机版 福州| 乌兰| 乐安| betway88 灵丘| 礼泉| 辰溪| 冠亚娱乐城 神农顶| 南雄| dafa888经典版网页 隆化| 高雄县| 涪陵| 丹徒| betway 冠亚娱乐 资源| uedbet官网 张湾镇| 沂水| 吐鲁番| 盐津| w88top优德官网中文版 鸡东| 图木舒克| 邹城| dafa888 宁津| ca888 沅陵| manbetx66 文安| 韦德1946 长白| 阳山| 岗巴| 文山| 万博app闪退 长葛| 闽侯| 拉孜| uedbet官网体育 泸水| 鹿泉| bwin88官网 江夏| 五河| 寒亭| 深州| 宁城| 融水| 88bf娱乐 万博体育官网登录 麻江| 桑植| w88官网 临安| 黄骅| 万博体育manbetx 吴桥| 越西| 冠亚娱乐 迁安| betway88 集安| 呈贡| 八公山| 平房| 凭祥| 建昌| bwin 武邑| manbetx 万博2.0苹果下载 冠亚娱乐城 达坂城| 泉港| 峡江| 聂荣| 清河门| uedbet体育 泰来| 宜昌| 88bifa 南海镇| 楚雄| 亚洲城ca88手机网页版 达州| manbetxapp娱乐 betway88 冠亚彩票 成武| 开江| 下花园| 万博官方app manbetx官网 疏附| 清水| 廊坊| 桃园| 金华| 博管理 盖州| 万博manbetx体育 新乐| 冠亚br88 优德888 松溪| 浠水| manbetx登录 新万博体育 南木林| opebet怎么样 化州| 乌苏| 宁城| 河池| 克东| youde88 洪洞| 九州娱乐 濠江| 依安| 喀什| 镇巴| 姚安| 边坝| br88冠亚 w88 br88 betway 乐天堂 狗万客户端 南川| manbetx 江达| 澄迈| 察哈尔右翼前旗| 锦州| 措勤| 浚县| 亚洲城手机客户端下载 漾濞| 芜湖县| 余庆| 南丰| 扎赉特旗| 冠亚1.85 申扎| 狗万万博ManbetX betway 让胡路| 88bifa 叙永| 乐昌| 全南| 福鼎| 新泰| 扶余| ca888娱乐城 东沙岛| 百喜88 冠亚br88 张家界| 宜丰| 临海| 鞍山| fun88 中方| br88冠亚 阎良| 88bifa.com manbet 88bifa.net 万博manbetx官方 马尔康| 香河| 狗万体育网站 万博体育世界杯 dafa888 冠亚彩票 尤溪| 洪泽| 冠亚娱乐 汾西| manbetx客户端 晋宁|

中国声音!听听习近平的APEC“金句”

2018-12-17 22:08 来源:深圳热线

  中国声音!听听习近平的APEC“金句”

  BR88  赵伊坪,原名赵廉越,1910年生于河南郾城。”近日,随着上海等地公布省级机构改革方案获批消息,记者查询发现,全国31个省区市的省级机构改革方案已全部获得党中央、国务院批准。

  视频中,肖某称“好大的雨”“还是走下高速”。同时,石家庄市城市客运管理处将在近期针对“两站一场”连续对黑车揽客展开打击行动。

  他就是冰天雪地里艰苦抗敌五年、在黑龙江五常县壮烈牺牲的抗联烈士王光宇。1937年5月赴延安出席中国共产党全国代表会议。

  农产品收购商都不愿去,村里好产品卖不上好价钱。从这个意义上讲,中国是当下世界开放合作当之无愧的引领者。

对转型企业退城搬迁腾出的土地,在符合土壤环境质量要求基础上,依据城市总体规划,科学合理调整用地性质。

  (记者段丽茜)(责编:陈思危、史建中)

  今起,本版推出“文物保护利用”系列报道,呈现各地探索的故事,关注那些曾经沉睡的文物,如何“活”了起来、“火”了下去。(记者程国媛)(责编:李梦文、白鸿滨)

  村里的自来水有了,路也通了。

  该负责人强调,“参加进博会最大的收获不仅仅是订单,还在于了解中国智能制造发展的大方向以及企业和市场的需求。虽然多年没在村里,但似乎没有太大变化。

  今起,本版推出“文物保护利用”系列报道,呈现各地探索的故事,关注那些曾经沉睡的文物,如何“活”了起来、“火”了下去。

  1xbet吧  “治乱存亡,其始若秋毫,察其秋毫则大物不过矣。

    针对个别供热不达标用户,石家庄市供热管理中心、各区政府、各供热企业正在全力解决问题,确保供热质量。近两年,山西能投以变革建造方式为出发点、以装配式建筑为切入点、以产业基地建设为支撑点,在全省布局了8个装配式建筑产业园区,全力推动山西建筑产业现代化。

  万博体育manbetx 亚洲城ca888 dafa888bet

  中国声音!听听习近平的APEC“金句”

 
责编:
炼数成金 门户 科学探索 算法 查看内容

中国声音!听听习近平的APEC“金句”

w88 不断拓展海外工作,积极弘扬三晋优秀文化,加深各国人民对山西的认知和理解,扩大了山西的知名度和影响力,为我省构建内陆地区对外开放新高地作出积极贡献。

2018-2-2 15:53| 发布者: 炼数成金_小数| 查看: 21412| 评论: 0|原作者: 清灵|来自: 阿里技术

摘要: 凑单作为购物券导购链路的一个重要环节,旨在帮助用户找到商品,达成某个满减门槛(比如满400减50),完成跨店凑单,完善购物券整个链路的体验。满减购物券作为大促中使用最广泛的一种营销手段,优势远大于红包、商 ...

网络 算法 模型 框架 超级计算

一、背景
凑单作为购物券导购链路的一个重要环节,旨在帮助用户找到商品,达成某个满减门槛(比如满400减50),完成跨店凑单,完善购物券整个链路的体验。满减购物券作为大促中使用最广泛的一种营销手段,优势远大于红包、商品打折等优惠活动,它不仅能给用户带来切实的优惠,而且能让用户买的更多,提升客单价。凑单作为用券的重要链路,旨在帮助消费者找到能使用同门槛优惠券的商品。
近期,阿里的凑单设计相比往年,有两个重大突破,首先是产品形态上的改变,往年,凑单只是一个商品推荐页,今年,凑单能够支持搜索、价格筛选、类目筛选、销量排序、价格排序等搜索功能。其次,算法上做了重大突破,基于Graph Embedding的bundle mining,bundle是打包购的意思,我们认为凑单的重要场景是当用户已经加购了商品A,还想找一个能一起打包买的商品B,而不是想找跟A相似的商品C,传统的u2i、相似i2i并不能满足凑单场景的需求,为了突破找相似等经常被人诟病的体验,我们甚至不能有u2i、相似i2i等逻辑,所以bundle mining变成凑单算法优化的重点,不仅能提升丰富性的体验,还能提升转化效率。


二、核心算法
1、基本思路
图是一种抽象程度高、表达能力强的数据结构,它通过对节点和边的定义来描述实体和实体之间的关联关系。常用的图有社交关系网络、商品网络、知识图谱等等。
  
用户行为是一个天然的网络图,边和节点往往有着各种丰富的信息,graph embedding是学习节点隐表示向量,在一个连续向量空间中对节点的关联关系进行编码,便于计算节点之间的关联关系,同时,graph具有传播能力,通过random walk可以挖掘多度关系,能有效的提升覆盖度,扩大召回。
  
Graph Embedding是学术界一个重要研究方向,比如deep walk,是语言模型和无监督学习从单词序列扩展到图结构上的一个典型方法,该方法将截断游走的序列当成句子进行学习,之后采用word2vec中Skip-Gram模型进行训练,得到每个节点的embedding向量。Line只针对边进行采样,Node2vec可以调节参数来进行BFS或者DFS的抽样。
  
所以Graph Embedding的基本思路是,对graph进行采样(Sampling),采出来的序构建模型(Embedding)。

2、主要技术
结合我们的场景,要挖掘共同购买的关系,直接通过item-item的关系挖掘也可以做到,传统的协同过滤,也可以做到,为什么我们还需要构建graph?因为graph具有传播能力,它不仅能有效的提取出来直接关联,而且可以通过游走策略,挖掘出来二度、三度的关系。我们认为,朋友的朋友,也是朋友,也存在一定的弱关联,有效的利用这种传播能力,能解决购买数据的稀疏性,大大的提升覆盖。
  
我们主要有三方面的工作:
一是,基于用户购买行为构建graph,节点:商品,边:商品间同时购买的行为,权重:同时购买的比重,可以是购买次数、购买时间、金额等feature;
二是,基于权重Sampling(weighted walk)作为正样本的候选,负样本从用户非购买行为中随机抽样;
三是,embedding部分将无监督模型升级成有监督模型,将基于weighted walk采出来的序,构造成item-item的pair对,送给有监督模型(DNN)训练。下图是算法框架图。

算法框架图

a) 构建Graph
上文提到,我们要挖掘商品间共同购买的关系(bundle mining),类似买了又买的问题,所以,我们构建的graph是带权重的商品网络,节点:商品,边:商品间共同购买的关系,权重:共同购买次数、购买时间。
  
为什么需要带权重的Graph?因为random walk等传统方法不适用商品网络,商品节点动辄上千万,其中大部分节点的关联性是很弱的,也就是冷门商品居多,只有少部分商品构建的graph是热点,如果采用random walk去采样,会采出很多冷门节点的序列,所以我们基于边的权重去采样(weighted walk),使采样尽量往热门节点方向游走,这样采样出来的样本置信度才更高。
  
因此,我们的输入是一个带weight的graph ,Graph定义:G = (V,E,W),V = vertex (顶点或者节点,在bundle的问题中,特指商品),E = edge(边,在bundle的问题中,特指共同购买) ,W = weight(边的权重,共同购买的次数、时间),如下图,接下来就要进行sampling。

商品graph

b)Sampling
传统的方法,比如deep walk,它的Sampling本质上是有两部分,首先,通过random walk的方式进行游走截断,其次,在仍给word2vec中Skip-Gram模型进行embedding之前,用negative sampling的方式去构造样本;这种随机采样的方法会大概率的将热门节点采集为负样本,这种方式适用于语言模型,因为在自然语言中,热门的单词均为无用单词(比如he、she、it、is、the)。对于我们的商品网络,刚好相反,热门商品往往是最重要的样本,如果采用negative sampling的方式去构造样本,模型肯定是学不出来。因此,我们基于边的权重去采样(weighted walk),使采样尽量往热门节点方向游走,以下图为例:
带权重的商品graph

举个例子来说,假设游走2步,从节点A出发,随机取下一个邻居节点时,如果是random walk算法,它会等概率的游走到B或C节点,但是我们的算法会以7/8的概率取节点C,再会以8/12的概率游走到节点D,最终很大概率上会采出来一条序walk=(A,C,D),对于原始graph,A和D是没有关联的,但是通过weighted walk,能够有效的挖掘出A和D的关系,算法详见:
算法实现是在odps graph平台实现的,一个分布式的图计算平台,离线graph有2亿条边,3千万节点,10分钟跑完所有的数据,实时部分,我们实现了每分钟较高可更新10w的Graph边的结构,如何在分布式odps graph平台实现这套算法详见另一篇ata,尽请期待

c)Embedding
上一部分介绍了如何构建了带权重的概率图,基于带权重的采样(weighted walk)作为正样本的候选,负样本从用户非购买行为中随机抽样;这一部分主要介绍embedding的部分,将基于weighted walk采出来的序,构造成item-item的pair对,送给embedding模型,我们构造了一个有监督embedding模型(DNN),规避无监督模型无法离线评估模型效果的问题。模型结构如下图。

有监督的embedding模型(DNN)

三、实现
1、离线
a)训练:离线模型在PAI平台上用tensorflow框架实现,抽取了历史50天的全网成交数据,大概抽取3000万节点,构建的graph,在odps graph平台做完weighted walk,产出2亿条样本,也就是item-item的pair对,训练至收敛需要2小时的时间 
b)预测:从全网所有行为中,随机抽取几十亿条pair对,去做预测,给每对item pair预测一个score  
c)上线:对每个种子商品取topN的bundle商品,打到搜索引擎的倒排和正排字段,从qp中取出每个用户的种子商品,基于倒排字段召回bundle商品,基于正排字段做bundle排序

2、实时
用户购买行为,日常和大促差异很大,为了能够实时的捕获用户实时行为,我们在porsche上建了一套实时计算bundle mining的流程:
a)数据预处理:在porsche上对用户实时日志进行收集,按离线的数据格式处理成实时的数据流  
b)Sampling:发送给odps graph实时计算平台,构建graph,做weighted walk,生成序,再通过swift消息发出  
c)Embedding:在porsche上做DNN模型训练和实时预测 
d)数据后处理:计算item的topN的bundle item list,实时写到dump和引擎

四、实验和结果
双十一预热期间,我们将bundle算法上线对比基准桶,提升很明显

1、点击:离线版bundle算法对比基准桶,ipv提升13%,实时版bundle算法在此基础上又提升4%,如下图:

2、丰富性:bundle算法对比基准桶,人均曝光叶子类目提升88%,人均曝光一级类目提升43%,如下图。


五、总结
graph的核心优势,具有传播能力,朋友的朋友,也是朋友,传统i2i(统计版i2i),只统计直接关系,而我们构建的共同购买的graph,可以通过游走挖掘多度关系,弥补购买行为稀疏的问题,有效的提升了覆盖率,我们离线实验发现,对比统计版本auc提升非常明显。
  
我们实现了实时大规模graph更新,每分钟较高可更新10万量级边,双11这么大的qps能够平稳运行。

六、未来和展望
凑单在未来还要继续努力,我们还有不完善的地方,在产品形态上,第一,价格preview没有做出来,用户不知道自己已经加购了多少,还差多少,能用多少优惠券,我们希望下次能在凑单页帮用户实时的算出凑单进度,第二,我们这次没有实时捕捉到入口种子商品,下次我们期望能做到,不同入口点进去,凑单的商品能和入口种子商品强相关;在算法优化上,把新颖性做强,尝试用graph bandit的方法,给用户投放一些没看过的但又相关的品类,根据投放的收益,设计一个合理的机制去explore。

欢迎加入本站公开兴趣群
高性能计算群
兴趣范围包括:并行计算,GPU计算,CUDA,MPI,OpenMP等各种流行计算框架,超级计算机,超级计算在气象,军事,航空,汽车设计,科学探索,生物,医药等各个领域里的应用
QQ群:326600878

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

热门文章

     

    GMT+8, 2018-12-17 16:47 , Processed in 0.150526 second(s), 23 queries .