【环球旅讯】爱彼迎(Airbnb)平台拥有超过500万的房源以及成千上万的旅游观光、徒步和其他体验活动,这无疑加大了消费者选择的困难,不过,爱彼迎推出的人工智能(AI)搜索可以为用户分忧。
在Arxiv.org发表的论文《将深度学习应用于Airbnb搜索》中,爱彼迎研究团队展示了历经两年时间构建的神经网络,这个网络是数学函数的多层次结构,大致模仿了人脑神经元的功能。目前,这个神经网络已经应用于Airbnb的网站和APP中,目的是提高搜索结果的相关性。
在报告发布前,爱彼迎推出了内部AI系统,将AI搜索的设计理念转化为产品源代码;另外,机器学习驱动的语言系统可以将房源评论信息翻译成用户更为熟悉的母语。
论文指出:“将AI应用于搜索排名是Airbnb最成功的机器学习案例之一。在初始阶段,大多数收益都是以梯度提升决策树(Gradient Boosting Decision Tree, GBDT)的模式创造,然而,随着时间的推移,收益会逐渐趋于稳定。本文讨论的神经网络就是为了保证收益继续增长。”
多数用户预订时,基本会先在爱彼迎网站搜索特定地理区域的可预订房源,得到的结果就是库存中抽样的有序房源。
最初,爱彼迎通过“手工”评分功能确定哪些房源和房型最受欢迎,现在识别和排列预测因素的GBDT模型取代了评分功能,这被称为“爱彼迎房源预订最重大的变革之一”。
随着在线预订的收益趋于平稳,爱彼迎希望借AI再次实现收益的增长。
爱彼迎开发的AI系统不止一个。首先,利用多个算法组合成的“生态系统”可以预测房东接受客人预订请求的可能性、以及客人设定预算并实际超额消费的可能性。由于搜索历史会被记录,而且各个算法模型都可以访问历史数据,这些算法系统通过分析用户沟通历史,实现机器学习。随后,需要对经过训练学习的算法模型进行测试,检验该模型是否能够实现预订量显著增长的目标。
爱彼迎的首个AI搜索系统,为后续更加复杂的系统奠定了基础。第二个AI系统采用了LambdaRank算法,这是一种应用监督式机器学习进行排名的算法。第三个是深度神经网络(DNN),一共涵盖了大约195种信息,包括价格、设施和历史预订次数,除此之外还有爱彼迎智能定价功能显示的房源价格,以及用户近期查看相似房源的信息。
模型训练必须反复试错。爱彼迎团队模型训练流程的首个迭代(通过CSV格式向TensorFlow模型提供数据)仅使用了大约25%显卡处理能力。优化之后可以提速17倍并将利用率提高到90%左右。
在测试某个神经网络时,爱彼迎团队使用与房源相对应的唯一ID作为特征,即将ID编入嵌入层(特性映射到实数向量),然后结合每个房源的独特属性对这些独特ID创建索引,原理与Netflix和亚马逊采用的推荐系统类似。但是,事实证明这是不可行的,因为嵌套需要每个房源拥有足够多的数据信息,而有些房源在现实环境中可能“条件有限”。
“最受欢迎的房源,一年也只能最多被预订365次,而一般情况下的房源预订次数则更少。”
用户注视某个房源的时间长短与测试时的预订概率似乎是相关联的,但是当上线一个可以同时预测预订概率和用户注视时间的模型时,并不会增加预订量。爱彼迎的研究团队推测,长时间注视可能受到各种因素的影响,例如房源高端但价格昂贵、房源描述冗长阅读费时、或者房源极其独特、甚至有时候是“房源新奇搞怪”等原因。
爱彼迎团队还在研究中新发现了一个影响入住率的因素:不同房源要求的最低租用时长不同,有时长达几个月,由此研究团队发现了地理区位偏好这一因素。比如,旧金山西海湾南部的位置比交通拥堵的桥对岸地区更受欢迎。
对AI搜索算法优化的钻研遇到那么多的困难,最终这些研究是否值得?爱彼迎团队对此持肯定的态度。
研究团队在论文中写道:“基于过往有较多的深度学习成功案例,我们最初对自己的研究方向持有极大的乐观,认为深度学习能够很便捷地替代GBDT模式,让我们获得可观的回报。最初我们试图只专注于以人工智能神经网络取代现有GBDT模式,看看能够收获什么。随后我们才发现,深度学习并不是简便的替代模式,其作用更多在于使系统实现规模化发展。因此,我们需要重新思考深度学习模式下的整体系统环境。”(本文由Xenia编译自VentureBeat)
评论
未登录
游客
2018-11-01
笼统而言,相对传统酒店,用户在决策民宿预订时,地理位置的影响相对最小,而图片,价格以及用户评论的作用最大。
而预订传统酒店时,地理位置的影响最大,其次是价格与品牌。