写在前面
21世纪的第二个十年,世界已然日新月异,计算机行业亦是如此。从高校的在校大学生,到走入社会的求职者,越来越多的人们前往,或者正在前往计算机的领域。那么,目前来说,计算机科学目前的热门研究方向和应用都有哪些呢?
本期岛主就来带大家仔细分析一下。
一、人工智能+行业
01、患者疾病模型和行为预测
由于新冠疫情的爆发,线上线下结合的治疗方式越来越受到重视,也产生了一系列相关的研究课题,包括并不限于:挖掘患者相关的医疗数据,进行疾病预测以及对应的疾病阶段预测;患者用药脱落风险预测,提高患者依从性;患者治疗后院外风险预测,是否会有并发症,抑郁等情况出现。研究这些课题,设计到医学数据挖掘,结合医学知识图谱和行为数据的预测模型、超长时间预测模型、少样本学习、医学预训练模型等技术。
02、 医疗数据的主动学习/半监督学习
不同于自然图像,医疗图像(如 CT、MRI)往往为 3D 数据,存在标注难度大、标注信息难以获取、标注成本高昂等问题。我们希望通过主动学习从未标注数据中挑选“更有训练价值的”样本,并进一步通过半监督算法,在降低标注成本的前提下,使深度学习在医疗图像相关任务上取得更好的效果。
03、交通大数据分析
基于交通大数据,研究城市时空动态预测、网络空间分析、空间决策优化、大数据可视化的理论方法和技术,并在实际场景中创新应用,解决复杂现实问题。
二、计算机视觉
01、激光点云的检测技术研究
对整个自动驾驶系统来说,高精度地图是核心技术之一,为自动驾驶提供超视距的感知能力,为车辆决策控制提供依据。高精地图生产需要消耗大量的人力财力,而生产效率的提升则非常依赖自动化算法的能力提升。在高精地图打底阶段,对于各要素的自动化算法的识别精度具有很高的要求,在更新阶段,则需要能够精确的找出点云上发生变化的要素。如何通过图像的数据提升在激光点云上的检测的效果、如何通过同一位置采集的多趟点云数据,准确的识别出发生变化的位置成了最热门的研究课题之一。
02、激光点云的线要素目标识别
车道线是高精地图业务中的最关键元素,精度是其最重要属性,在城市环境 2D 投影图噪音大,识别容易受车辆残影,护栏等干扰,直接在 3D 点云中检测车道线就非常必要。该研究包括如何基于点云深度学习,端到端地进行 3D 车道线检测,实现车道线的超高精度检测,简化算法流程,提高数据质量,加快数据更新速度,极大提高生产效率。
三、定位技术
01、基于泛在信号的智能感知与定位技术研究
近年来,随着各种移动和边缘智能设备以指数般速度的增加增加,感知、定位、应用的广度和深度得到了不断拓展,出现了基于泛在信号的智能感知新模式。该技术通常借助于日常使用的移动终端设备(手机、手表、音箱等),利用各类无线信号如 WiFi 、手机 UWB、物联网 LoRa等,提供对个体行为活动和位置的感知能力,实现定位精度的优化,开展对已有 WiFi、LoRa、UWB、蓝牙等无线信号感知和定位效果的对比,研究定位性能提升方法,研究新兴消费类电子设备中UWB 信号在各类场景如定位追踪、呼吸检测、手势识别等方面的应用。
02、基于图神经网络的定位算法研究与应用
随着移动互联网的发展,基于无线信号(WI-FI,蓝牙等)的网络定位方式获得了较大的研究关注和应用。传统方法依赖于 GPS 数据挖掘无线信号的位置和特征,部分场景由于GPS信号缺失定位造成精度较差。图神经网络具有直接对图进行特征提取和表示的优势,可以用于处理上述无线信号网络,提升定位精度,通过将图神经网络、定位信号处理和深度学习结合产出端到端的定位系统,可以解决实际场景中的定位问题。
03、基于视觉 SLAM 技术的定位和建图研究
随着自动驾驶的发展和计算机视觉技术的成熟,车辆对于自身定位的精度要求不断提升, 视觉 SLAM 作为机器人自主导航的经典方案,获得了越来越多的关注,在研究深度和创新性方面不断提升。SLAM可以辅助车辆进行同步定位和建图,解决一些场景卫星信号无法定位的问题。
四、机器学习及其相关应用
01、深度图学习中分布外(OOD)和长尾(Long Tail)问题的研究和相关应用
图数据结构是实际应用中广泛出现的数据形式, 比如分子建模、社交网络建模、化学反应建模以及知识图谱等. 因此深度图学习的研究一直备受关注。分布外(OOD)和长尾(Long Tail)学习问题是目前机器学习领域最具挑战性的研究课题, 其聚焦在算法和理论层面, 如何使模型在 Non IID 及分布不均衡的数据中具备泛化能力,在药物发现、复杂系统建模等领域有巨大应用。
02、复杂游戏中的强化学习技术研究
游戏是人工智能算法的试金石之一,复杂游戏里的智能决策是当今研究热点和难点。决策和行动是智能体能够影响或控制环境,并达成其目标的唯一方式,人工智能领域中一个基础且根本的问题,就是如何让 AI 学习决策和行动,该方向旨在构建完全自主的智能体(能够从观察和感知中提取并利用相关信息学习可以适用于多种任务的模型)。
五、视觉及多媒体计算
01、基于深度学习的三维人脸重建与高保真渲染
借助于工业级的多视角高质量三维人脸表情数据集,探索基于深度学习与传统优化方法相结合的三维人脸重建和人脸图像合成算法。能够针对高光和阴影的光照条件、人脸不同情绪下的复杂表情和头部姿态等复杂条件下,高质量、稳定的获得人脸重建结果。
02、面向海量游戏视频的多模态自动标签算法
目前通用视频标签任务存在几大难题:标签体系极其庞大;标签关系错综复杂,部分标签有层次关系或有一定的关联性;每段视频标签数目不固定;标签长尾分布;人工标注质量参差不齐等问题。通过多模态深度学习,融合视觉、自然语言和语音等多模态特征,并结合视频细粒度识别理解算法,开发面向海量游戏视频的自动视频标签算法和服务成为了一大挑战。
六、广告与推荐系统
01、多模态广告融合推荐算法研究
推荐系统的物品侧一般会有图像、声音、文本等多种模态的信息,这些信息可以从多个方面刻画物品。如何去表征这些多模态的信息,并且将这些信息融入到推荐模型中,尤其是融入到当前的用户兴趣模型中,去动态地识别图像和文本中最影响用户兴趣的部分,是我们面临的一大挑战。
02、融合多场景的推荐系统研究
微信中存在不同的推荐场景,基于用户兴趣、社交等不同维度,满足用户多方面的信息获取需求,通过充分利用不同场景和业务的数据,可以进行推荐系统的多场景多任务联合优化。
03、基于知识图谱的兴趣推理及其在推荐系统中的应用
推荐系统中,往往基于用户-物品的交互来进行推荐。知识图谱中蕴含的结构化知识可以辅助推荐系统的可解释性,并扩展推荐系统的多样性。现有的知识图谱辅助推荐的方法,多考虑建模物品之间的实体与关系,而较少考虑刻画兴趣点之间的复杂关系及其演化。基于知识图谱的兴趣推理与扩展技术,通过弱监督学习、知识图谱结构挖掘、常识推理、强化学习等技术,习得基于用户-物品交互背后的显示兴趣表示,生成可解释的兴趣扩展路径。
七、知识图谱与自然语言处理
01、文本理解
研究和探索基于语义分析和知识推理的深度文本理解技术,包括但不限于新型的文本理解模型架构、针对社交文本的语言理解技术、引入常识及外部背景知识的语言理解模型、知识图谱的表示及推理等。
02、自然语言处理技术在软件安全领域的应用研究
随着软件复杂度的不断提升,大规模源代码和二进制软件的漏洞挖掘工作面临新的机遇和挑战。该项目希望把自然语言处理技术和深度学习相关技术(例如实体识别、关系抽取、文本生成、机器翻译、文本表示、文本相似度分析等)应用于软件安全研究中。
03、声纹识别
声纹识别技术是一种根据人的声音来进行身份判定的人机交互方式。该技术在智能家居、会议系统、商业支付、车载、司法刑侦等方面发挥着重要作用。目前基于短语音的身份判定受到研究者的广泛关注,深度学习技术的发展大幅提升了声纹识别的效果。
八、数据挖掘
游戏社交推荐算法优化
游戏社交推荐算法具有较多应用场景,如好友推荐、战队推荐、物品推荐、网络传播等,同时游戏社交数据纷繁复杂,包括玩家图片、社交网络、游戏数据等。如何设计有效的推荐算法,具有较高的研究价值。
九、计算机网络与物联网
01、超低延迟实时网络传输技术研究
从近年来直播和视频会议的火爆到 VR、元宇宙等概念的兴起,应用对网络交互的实时性要求越来越高,如何搭建一套支持高带宽和超低延迟(10ms 级别)的网络系统越来越成为一个计算机网络行业急需解决的问题,主要研究包括:具备超低延迟能力的流控/拥塞控制算法研究,低延迟友好的浅 buffer 路由研究等。
02、智慧交通 5G 低时延实时流媒体传输和应用关键技术研究
随着互联网业务在 ToB 垂直领域的蓬勃发展,如港口、航司、先导区、高速等场景均带来了强烈的行业属性,该研究旨在研究和解决 5G 流媒体、实时数字孪生、远程控制等技术在上述移动、低时延等环境中传输和应用时遇到的问题,以提升终端客户的业务体验。
总结