肥猫SEO论坛

找回密码
立即注册
发新帖
高端网站建设 可签合同 可上门沟通站群程序定制/蜘蛛池租用全行业SEO接单QQ1624516415全行业SEO接单QQ1624516415
2000+站点 外链一键通发原创SEO文章代写【点击】点击加入本站VIP 发帖免审核广告位招租

23万

积分

0

好友

7万

主题
发表于 2021-9-17 07:49 | 查看: 178| 回复: 0
买房助手产物思绪:大数据+呆板进修=AI置业参谋
在万物联网的互联网+期间,咱们可否用大数据与AI技能,为买房这一需求赋能,让人们的需求在买房助手的助力下加倍便捷,加倍智能?笔者的一系列产物构想证实,这个思绪也许能获得实现。



年前的时辰我获得了一份某一线都会的二手房源信息,包含了跨越数万条衡宇数据,并且内容十分完备,因而我就想着能用来做点甚么,便萌发了设计一个大数据+呆板进修的买房助手的产物构想。

下文其实不会触及太多繁杂的技能道理,只是简述我的产物思绪。
1、产物设计1. 需求阐发:为甚么买房
一小我为甚么要买房,这是一个与当下社会情况及法令政策、人文情况、经皇冠交友济情况、家庭瓜葛、本身环境夹杂在一块儿的繁杂需求,有多是刚需,也有多是投资,另有可能纯洁收迫于别人意愿的,想要把这些需求举行客观的丁丁视频收拾是很坚苦的事变,由于这个需求的表示自己便可能很不客观的。

购房的表象缘由极可能是如下四个方面:

刚需

购房者或其支属必要固定居处、入户、后代上学、旧衡宇被拆迁或破旧没法栖身等缘由,发生的刚性需求,买房可以说是为数未几的解决方案中,社会认同性最高的、也是最轻易操作、综合结果最好的一个方案。

改良型需求

为了改良栖身情况,追求更宽阔的空间、电梯,更好的医疗资本、教诲资本、交通办法等,一般在已具有一套房的根本上,再次采办的房产,俗称买“二套房”。

投资

房产的投资标的目的有不少,对付室第而言,重要又分两种:房租收入、转手收入。
房租收入就是寄托屋子出租得到房钱的延续性收入。转手收入则是在购房一段时候后将衡宇再次贩卖给其他购房者,以得到的一次性收入,俗称“找人接盘”。
投资对屋子的地舆位置、所属地域当前及将来的经济、治安、交通、教诲、医疗情况都比力多的讲求。

其他

由于屋子的代价对付大部门人而言都是很是昂扬的,再加之不少地域存在限购政策,让“感动消费”对付平凡购房者而言几近不成能成为缘由。可是不解除仍然有此类或其他的购房缘由。

刨去征象看本色,在这些表象缘由中咱们可以抽掏出一些可量化的指标:
衡宇本身:衡宇的产权、面积、状态、是不是有小区、是不是有供暖等等政策:是不是限购、限售及其他的政策限定如“满二”、“满五”、“独一”,是不是可以入户。教诲:是不是学位房、学区房,对应黉舍的评级如“市一级”、“省一级”交通:是不是有地铁、公交、对付有车一族另有是不是有车位其他周边:周边是不是有大病院、景区,病院又分三甲、卫生院等。景区也有分歧的星级评级地域经济:对付改良型和投资购房者而言这点比力首要,他们可能会去存眷本地的GDP、将来计划,如珠三角、大湾区等。衡宇售价:之以是零丁列出来,而不放在衡宇本身的项目中,一是由于衡宇的代价实际上是“绝大部门场景下”购房者起首要面临的问题,并直接影响他们对其他指标的需求水平;二是衡宇的代价/价值是由以上其他指标配合影响“塑造”的;三是有些房源是请求购房者一次性付款的,可能会筛掉大部门客户。本身环境:本身经济环境、是不是具有购房资历、贷款资历等。
以是咱们要顺藤摸瓜,弄清晰购房者或决议购房的重要介入人,在他们心里,到底哪项是决议身分,哪项是次要身分。
2. 需求匹配:到底要甚么
完成为了需求阐发后,咱们便可以重新房大数据、二手房大数据中,去寻觅那些合适前提的房源:
可购房类型:室第、商住两用、公寓、小产权(不举荐)可承当经济范畴:单价、总价衡宇环境:面积、户型、朝向、电梯、楼龄、楼况、小区面积、容积率、绿化率配套教诲:幼儿园、小学、初中、高中、大学,又可以详细细分黉舍的品级配套交通:公交、地铁、车位、高速路、高铁、铁路等其他配套:病院、公园、景区周边经济情况:街道情况内是不是有贸易街、大型超市;县区定位是不是自贸区、金融区;都会定位是不是珠三角、大湾区等。
由于我拿到的是特定都会的数据,加之斟酌了更多刚需购房的场景,以是关于景区、县区/都会定位这些更多与改良型、投资购房相干的内容,我后文中再也不胪陈。

经由过程让用户填写/输入上面的前提,便可以搜刮出合适他们的需求的屋子,并可以经由过程代价、面积、地铁、小区、电梯等举行排序或挑选,然后再一个个实地去看看,找出性价比最高的那家,然后买定离手。

这时辰你就会说,这特么不就是房全国、链家APP能做的么,跟传统的有啥纷歧样?哪里AI了?……
3. AI建议:找出性价比最高、最靠得住的房源
我将所有的房源数据举行收拾后,经由过程分歧的数据钻研方法,对每一个房源信息举行阐发。

线性回归:开端阐发



线性回归是操纵数理统计中回归阐发,来肯定两种或两种以上变量间互相依靠的定量瓜葛的一种统计阐发法子,应用十分遍及。

对所稀有据举行线性回归,可以获得该都会每一个区、每条街道、分歧的地铁线、学区房/学位房、楼龄、是不是有电梯等对房价的影响因子。

有了影响因子,咱们便可以反推一个屋子的代价组成比例、是不是真的值钱等。可是线性阐发只作为一个开端阐发的手腕,上风是运算速率快、数据成果简略可见,错误谬误则是果断屋子价值的正确率其实不那末高。

经由过程将线性阐发的成果告诉用户,可以帮忙用户比拟分歧的房源价值组成,和当前地域对房价的影响身分,可以作为用户购房决议计划辅助东西之一。

聚类:区域优选



将物理或抽象工具的调集分成由雷同的工具构成的多个类的进程被称为聚类。由聚类所天生的簇是一组数据工具的调集,这些工具与统一个簇中的工具相互类似,与其他簇中的工具相异。“物以类聚,人以群分”,在天然科学和社会科学中,存在着大量的分类问题。聚类阐发又称群阐发,它是钻研(样品或指标)分类问题的一种统计阐发法子。聚类阐发发源于分类学,可是聚类不即是分类。聚类与分类的分歧在于,聚类所请求划分的类是未知的。

经由过程对房源地舆位置举行聚类,可以将全部都会划分出多个糊口片区。咱们可以简略猜测/认为,若是一个房源在这些片区中间区域,将能得到更好的糊口办法保障,若是不在这些片区中、零星散布的房源所配套的糊口办法将较差。



某市二手房源热力求

至于为甚么要聚类?

这个问题就犹如人类文明为甚么老是发源于大江河畔,工业文明为甚么总发生在矿产丰硕、交通便当的处所同样。

都会的成长扶植、人类的糊口都遵守着必定的纪律,若是一个处所有遍历的地铁,有好的黉舍,反过来试问,阿谁处所如果没大片室第没生齿,你会感觉合适常理么?

虽然说是常理,就像区别一小我的性别同样,只有DNA检测才是最科学的手腕,其他所有的表征都不克不及作为终极果断根火星直播据。

支撑向量机:性价比阐发



支撑向量机(support vector machines,SVM)是一种二分类模子,它的目标是寻觅一个超平面来对样本举行朋分,朋分的原则是距离最大化,终极转化为一个凸二次计划问题来求解。

支撑向量机因为利用了超平面,以是能处置更多线性回归不克不及很好解决的繁杂模子。

将所有房源数据,以除代价之外的各项指标作为练习数据,将代价作为成果数据,然落后行支撑向量机进修。然后利用练习好的模子,对所有房源@经%OS717%由%OS717%过%OS717%程除代%43HLX%价@之外的各项指标举行测试,展望该房源预期的代价。

咱们将展望成果作为该房源的预期代价,将原价作为该房源的现实代价。

房源值率=预期代价/现实代价

经由过程计较房源的值率,便可以晓得一个屋子是不是值这个钱,将步调2经由过程前提搜刮出来的房源,举行是不是优异区域、是不是性价比最高两项指标综合排序,将“真 · 性价比”最高的房源举荐给购房人,如许的话可以帮购房人省去很是多的时候挨个阅读搜刮成果,举行比拟,然后确认优先实地去看哪些屋子。



我利用某舆图数据可视化做的值率阐发

房源定阅:AI好房举荐

屋子其实不是短期内看几回就可以决议采办的,有可能当前所有房源终极购房者都不得意。可是咱们晓得了该用户必要的房源类型后,若是我的房源数据库有新的房源进来,我就会用练习好的聚类模子、支撑向量机模子对该房源举行“展望”,看看新居源是不是合适设定的举荐阈值(如值率、离近来的聚类中间间隔),若是是,则推送给购房人,反之则不举荐。

此外经由过程用户的阅读记实、驻留时候、是不是有预约看房,再连系“随机丛林”或其他呆板进修法子,从所有房源中找出与之类似的房源举荐给用户。



决议计划树

在呆板进修中,随机丛林是一个包括多个决议计划树的分类器, 而且其输出的种别是由个体树输出的类此外众数而定。 Leo Breiman和Adele Cutler成长出推论出随机丛林的算法。

假如某购房者看了200套房源的页面,可是只展望看了此中20套房源,咱们便可以将这些阅读过的房源标识表记标帜为两类:会预约、不会预约,然落后行随机丛林练习,再接着将数据库中新参加或阅读次数大的、有前提的话也能够将所稀有据都举行一遍展望,看看是能获得会预约的成果,若是会则举荐给该用户,则有更大的成交可能性。当购房者看了更多房源后,经由过程不竭练习,这个展望模子将愈来愈正确。
4. AI阐发:用户画像
经由过程以上的呆板进修法子,对房源举行阐发,找出性价比高的,又或是雷同的房源。咱们可以思虑一下,是不是能用一样的技能,然后连系每一个用户看的了分歧的房源,然后对用户举行归类。

若是此中某些用户终极在我的平台上完成的购房,然后我便可以按照这些用户的看房特性(如阅读时候、阅读时长、旁观房源的特性、用户其他的注册信息、预约频率、预约时候等)举行呆板进修,然后对体系中其他的用户举行阐发,展望这些用户的潜伏购房可能,并举行更有针对性的营销。

同时咱们也能够依照用户看房内容,对用户举行偏好划分,如看了好久不买的,总看某一类房源的、或有其他潜伏配合特性的,然后聚类区别。终极让运营沈阳交友/中介可以对用户按标签举行“范畴进犯”,极大的低落了事情本钱。
2、总结
跟着大数据及呆板进修的不竭成长,我信赖很快就会有雷同的东西面世,因为AI将带来更精准、高效的衡宇举荐计谋,如今由各家分歧的中介凭直觉带着你一套套屋子的瞎逛的年月可能一去不复返。

并且如今愈来愈多屋子有VR全景的信息,将来经由过程呆板视觉对房间内部采光、房型设计、衡宇新旧状态阐发也将变得可能,说不定到时辰还能将你对衡宇的气概、色彩爱好输入进去,就可以举荐合适你的衡宇信息。

本文由 @iCheer 原创公布于人人都是产物司理,未经作者允许,制止转载。

题图来自Unsplash,基于CC0协定。

收藏回复 显示全部楼层 道具 举报

您需要登录后才可以回帖 登录 | 立即注册

QQ|Archiver|手机版|小黑屋|肥猫SEO论坛 ( 鄂ICP备16024533号 )

GMT+8, 2024-5-19 05:36 , Processed in 0.024419 second(s), 19 queries .

Powered by SEO论坛 X3.4

Copyright © 2016-2022, 武汉肥猫网络科技有限公司.

快速回复 返回顶部 返回列表