今年京东城市继续担任了CNCC2019“智慧城市与城市计算论坛”的发起者和组织者,该论坛由京东集团副总裁、京东城市总裁郑宇担任论坛主席,由京东智能城市研究院资深研究员、京东城市AI平台部负责人张钧波担任共同主席和论坛主持人。
本文转载自京东城市
作为中国计算领域规模最大、规格最高的学术、技术、产业交融互动的盛会,CNCC2019于10月17-19日在苏州金鸡湖国际会议中心举办,该大会由CCF主办,创建于2003年,至今已成功举办十五届。
作为城市计算领域的领军者,京东城市曾于2018年发起了CNCC首届“中日韩智慧城市与城市计算论坛”,并邀请中日韩三国智能城市和城市计算领域顶级学者共同分享、讨论智能城市的历史、现状和未来。
今年,京东城市继续担任了CNCC2019“智慧城市与城市计算论坛”的发起者和组织者,该论坛由京东集团副总裁、京东城市总裁郑宇担任论坛主席,由京东智能城市研究院资深研究员、京东城市AI平台部负责人张钧波担任共同主席和论坛主持人。
张钧波
10月19日下午,论坛邀请了来自京东集团、清华大学、北京航空航天大学及电子科技大学的业内专家学者,分别于对城市计算的研究领域,产业现状和发展方向进行了探讨,并展望科技公司在服务本国的基础上,如何更好推动各自所在产业或相关领域在全球范围智能城市建设中发挥更大作用,论坛吸引了众多业内人士的参与和交流。
论坛现场
以下为“智慧城市与城市计算论坛”精彩回顾。
鲍捷:用AI和大数据打造智能城市
——时空大数据分析挖掘
论坛伊始,来自京东集团的鲍捷带来了“用AI和大数据打造智能城市——时空大数据分析挖掘”的演讲,他目前是京东数科智能城市事业部数据管理平台部负责人,之前曾在微软亚洲研究院工作多年,具备近十年的时空数据挖掘和管理经验。
在演讲中,鲍捷首先回顾了时空数据挖掘的历史及目前大数据处理系统在智能城市建设中所面临的难题。他认为,目前在实际工作中,当面对不同的数据类型、不同的查询方式和不同数据源和领域的时空数据所需的融合索引方式时,现有的大数据存储和查询组件无法很好的支持时空分析,这就造成了在实际应用中对城市中的万千数据无法有效的进行管理、融合和应用。
针对这些痛点问题,京东城市所研发的“城市计算平台”首先把城市数据分为2类,即基于点的数据和基于网络的数据,然后根据相关性,再把数据分为3类,即时空静态数据、空间静态-时间动态数据和时空动态数据。
时空静态数据以POI数据(兴趣点数据)最为典型,比如位置固定的加油站、商场、地铁等,最大特点就是人流量的变化,其他属性不变;空间静态时间动态数据以IoT数据(物联网数据)最有代表性,传感器数据随时间推移在变动;时空动态数据最直观的就是Checkin数据(打卡数据),滴滴与Uber上的请求就是不同人和车建立联系的调度过程。由于城市内部最为复杂的就是轨迹数据,集合了时间、空间、方向等信息,因此上图中第二行的基于网络的数据就以道路网数据集作为典型代表进行研究。进行明确的分类后,京东城市独创了针对智能城市建设的时空大数据管理平台,在底层的数据库之上,通过建模、预处理数据、对数据进行索引存储和查询分析,为城市管理者和客户提供可视化的数据分析呈现,最终为决策提供科学化的辅助建议。
鲍捷介绍,由于现有机器学习和云计算处理能力达不到有效处理时空数据的要求,京东城市在自研的时空大数据平台JUST(JD Urban Spatio-Temporal Engine)上加入了各类的时空数据建模的能力,常用的时空/轨迹数据预处理能力,索引能力,支持类似于SQL的时空查询operator来方便数据工程师的使用。他介绍整一个JUST系统已经在京东城市内部的各个项目中(物流地产选址和物流轨迹挖掘),以及在南通等外部得到了使用。最近也开放了公测版本给外部的研究人员进行测试(http://just.urban-computing.cn)。 他希望这个系统能够解决大家在处理时空数据中遇到的各种效率问题。
数据的获取和管理层完成有效的归类、标准化之后,数据分析层就会变得更加高效。可以说,对时空数据思考地越深,技术复杂度就越高,其操作手法就越加精细。特殊的AI算法和机器学习算法让城市计算平台对这些数据都能进行处理,从而形成 “新的技术门槛”。
在演讲的最后,鲍捷认为,针对智能城市建设所研发的时空大数据挖掘技术,核心能力是通过生态的可扩展性、新的存储特性和索引,得以让最终的计算效率显著提升。目前,京东城市已将该技术成功应用于智能监测违章停车、物流地产选址等多个实际项目中。
更多信息可参看京东城市主页:http://icity.jd.com/。
李勇:城市时空数据质量增强与移动行为预测
随着城市移动网络和无线定位技术的飞速发展,记录用户时空行为规律的大数据在城市计算等诸多应用场景中变得日益丰富,其社会、经济、学术价值也引起了产业界和学术界的广泛关注。然而,城市时空大数据规模大且质量低、所蕴含的行为模式复杂多样,使得传统数据挖掘方法难以适应。
李勇博士长期从事数据科学与智能方面的科研工作,他目前是清华大学电子工程系副教授,博士生导师,ACM/IEEE高级会员,在本次论坛中,针对上述问题,他带来了城市时空数据质量增强与移动行为预测的演讲,系统介绍如何通过深度学习技术实现城市时空数据的质量增强与移动行为的准确预测。
李勇认为,第一,通过设计深度注意力机制和深度表征学习模型,可解决城市时空大数据噪音显著、行为模式复杂、存在高阶时空相关性等科学问题;第二,可通过提出时空移动行为相似度测量方法与时空行为预测模型,实现高准确率的个体与群体行为预测;第三,可通过建立开放的城市时空大数据深度处理与挖掘平台,实现在智能交通、智慧旅游、城市规划等重要场景下的实际应用。最终,可实现城市时空数据的质量增强与移动行为的准确预测。
王静远:数据智能驱动的城市认知、管理与服务
城市是人类生活的第一空间,全世界有超过50%的人口生活在城市空间内。城市密集的人口聚集,在促进人类社会的发展的同时,也带来了交通拥堵、环境污染、人口爆炸等“城市病”问题。
为了破解这些问题,北京航空航天大学计算机学院副教授,博士研究生导师王静远带领北航智慧城市研究组(Beihang Interest Group on Smart City,BIGSCITY),通过使用大数据与人工智能相结合的数据智能技术(Data Intelligence),从城市的认知、管理与服务角度,进行了跨学科的探索研究。
在演讲中,王静远介绍了包括基于动态时空数据与可解释AI的城市认知,针对危险品与流行病防控的城市安全管理,以及深度学习与启发式搜索的城市出行服务。内容涉及计算机科学同城市规划、城市管理学科等学科的交叉融合,是一种数据智能为核心的多学科协作研究范式。
郑凯:基于空间众包技术的隐藏兴趣点挖掘
隐藏兴趣点(Hidden Point of Interest,H-POI)是指在社交网络中很少被提及或者签到(check-in)的地点。由于签到记录很少,这类兴趣点极容易被搜索/推荐引擎忽略,从而导致一些优质的兴趣点无法被用户访问到。
针对这些问题,电子科技大学教授,博士生导师郑凯带来了“基于空间众包技术的隐藏兴趣点挖掘”的演讲,他介绍了团队在SIGKDD2019上发表的最新研究成果,该工作针对隐式兴趣点(HiddenPoint-of-Interest)信息量少、难以客观排序的挑战,在国际上首次提出了利用空间众包机制对其进行有效排序的方案。该工作扩展了传统众包的答案聚合框架,引入了异质POI对作为众包任务,考虑众包工人给出答案的准确率,采用主动学习方法控制排序成本,在2个公开标准数据集上取得了良好的效果。
他提出了一个两阶段的解决方案,着力于降低排序的时间代价、人力成本并保持排序的准确性。
在第一阶段,也即离线阶段,通过分析兴趣点的空间文本特征来建立候选任务集,并提出了一个可以有效缩减任务集大小的贪心算法,同时,利用数据驱动的方法计算了众包工人完成特定任务的可靠性。
在第二阶段,又称在线阶段,为了减少众包成本,在考虑工人完成任务的可靠性,流行兴趣点排序的准确度和当前模型的不确定程度后,提出了一种主动学习算法来选择下一个最具信息量的任务以及一种跳跃式搜索(Tree-constrained Skip Search)策略来减少搜索的时间代价。实验表明所提出的框架可以在派发任务数较少的情况下依然达到较高的准确度。
论坛嘉宾合影 左起分为别鲍捷、郑凯、张钧波、王静远、李勇