ENGLISH中文版
学术活动
所在位置
学院首页>>学术活动>>正文

钱学森大讲堂第85期—微软AI讲堂

2019年04月10日 11:44  点击:[ ]

讲座名称:钱学森大讲堂第85期—微软AI讲堂

讲座时间:2019-04-15

讲座地点:主楼B203

讲座人:罗翀 /代季峰/David Wipf

讲座一:

讲座题目:视觉物体跟踪及相关研究

讲座时间:2019年4月15日 晚7时

讲座地点:主楼B203

讲座人:罗翀—微软亚洲研究院主管研究员

讲座内容:

In this lecture, I will mainly talk about the status and prospect of visual object tracking (VOT), which is one of the most fundamental and challenging tasks in computer vision. VOT finds numerous applications in surveillance, autonomous systems, and augmented reality. In the past three years, deep learning has significantly advanced the state-of-the-art of VOT. We have also carried out several pieces of tracking work based on Siamese convolutional neural network. Two papers were accepted by CVPR and one tracker won the second place in the VOT-2018 real-time tracking challenge. At the end of the lecture, I will introduce our recent efforts on multimodality video analysis, which we believe is the future of video understanding.

讲座二:

讲座题目:视觉中的几何形变建模

讲座时间:2019年4月15日 晚7时

讲座地点:主楼B203

讲座人:代季峰—微软亚洲研究院研究经理

讲座内容:

在视觉识别任务中,一个重要的挑战是如何恰当处理和建模几何形变,包括尺度、姿态、视角以及物体部件的移动等。从特征工程的时代开始,一系列著名的算法就被开发出来以尝试解决这个问题,包括SIFT,DPM等。但受限于它们的特征表达能力和局限的变性建模能力,其性能受到了很多的限制。在深度学习的时代,网络特征的表达能力大大的超出了之前手工设计的特征。但是,现有的网络模块依然难以对几何形变进行有效的处理和建模。本次talk中将会介绍在深度神经网络中的几何形变建模技术,它们能够大幅度的增强深度神经网络的几何建模能力,在各种识别任务中取得巨大的性能提升。

讲座三:

讲座题目:Diagnosing and Enhancing VAE Models

讲座时间:2019年4月15日 晚7时

讲座地点:主楼B203

讲座人:David Wipf—微软亚洲研究院主管研究员

讲座内容:

Although variational autoencoders (VAEs) represent a widely influential deep generative model, many aspects of the underlying energy function remain poorly understood. In particular, it is commonly believed that Gaussian encoder/decoder assumptions reduce the effectiveness of VAEs in generating realistic samples. In this regard, we rigorously analyze the VAE objective, differentiating situations where this belief is and is not actually true. We then leverage the corresponding insights to develop a simple VAE enhancement that requires no additional hyperparameters or sensitive tuning. Quantitatively, this proposal produces crisp samples and stable FID scores that are actually competitive with a variety of GAN models, all while retaining desirable attributes of the original VAE architecture.

讲座人介绍

罗翀—微软亚洲研究院主管研究员

博士,IEEE资深会员。2003年加入微软亚洲研究院,现任智能多媒体组(Intelligent Multimedia Group)主管研究员,中国科学技术大学、西安交通大学兼职博导。长期从事视频通信、多媒体云计算、计算机视觉等领域的基础理论和应用研究工作。在无线传感器网络中基于压缩感知的数据采集技术、无线网络中视频伪模拟传输、以及视觉物体跟踪等方面做出了开创性工作。先后在ACM MobiCom、IEEE Infocom、IEEE CVPR 等顶级学术会议上发表多篇论文,拥有十余项国际专利。曾获得上海市计算机学会2005年至2015年期间“上海市网络领域最有影响力论文奖”。

代季峰—微软亚洲研究院研究经理

博士,于2009年在清华大学自动化系获得本科学位,后继续在本系直博,于2014年获得博士学位。于2012年至2013年间在UCLA访学。2014年至今在微软亚洲研究院视觉组工作,从事图像理解和深度学习领域的科研。他在本领域顶级会议期刊上发表文章二十余篇,Google Scholar统计引用3500余次。他是R-FCN物体检测算法和Deformable ConvNets的作者。他和团队曾获得COCO物体识别竞赛的两次第一名(2015,2016)和一次第三名(2017)。他曾担任AAAI 2018的Senior PC Member。

David Wipf—微软亚洲研究院主管研究员

博士,微软亚洲研究院视觉计算组主管研究员 , 在2011年加入微软亚洲研究院之前, David Wipf获得了美国弗吉尼亚大学电子工程的最高荣誉学士学位,以及加州大学圣地亚哥分校的电子和计算机工程硕士和博士学位。他的研究兴趣包括非凸优化,稀疏/结构化的评估,深度生成模型,深度网络压缩。他是多项奖学金和研究奖项的获得者, 包括2012 IEEE信号处理学会最佳论文奖, Biomag 2008 青年研究员奖, NIPS 2006杰出学生论文奖。他目前是Journal of Machine Learning Research 杂志的编辑,同时他也是ICML、 CVPR、 ICCV、NIPS/NeurIPS等重要学术会议的Area Chair。

转载自西安交通大学学术资源平台

原文地址:http://info.xjtu.edu.cn/info/1041/26681.htm

下一条:哥伦比亚大学工程学院硕博项目申请宣讲会?

关闭

版权所有:电子与信息工程学院 技术支持与维护:西安交通大学网络信息中心
 地址:陕西省西安市咸宁西路28号 邮编:710049
读取内容中,请等待...