首页 / 新闻速递 / 正文

STEM课程:2021计算机视觉与机器学习课程学年总结

六月 21,2021

CVML (计算机视觉与机器学习) 课程由上海交通大学研究生为上中国际部学生讲授,主要围绕机器学习的理论、实现和应用展开。从深度学习算法的数学基础和实现到人工智能的现状,学生们学习了如何使用机器学习来开展不同领域的研究。

252A7

1EC52

在第一学期结束时,学生们需要设计一个转移艺术风格的项目。该程序会接收两幅图像,一幅艺术品和一幅照片,并产生一幅机器生成的艺术品,其中包含原始艺术品的风格特征和照片的景象。学生们分组执行程序,创建用户界面,然后收集样本输入到程序当中。学生们首先使用了PyQt设计了一个用户界面,PyQt工具包含了用户界面的图形和部件。之后,学生们实现了从艺术作品中提取风格特征和课堂上介绍的从照片中提取内容特征的算法。最后,为了测试程序,学生们收集了输入数据,包括风格图像和照片,并制作了自己通过机器生成的艺术品。

原图:

艺术风格:

结果:

1E7DF

其中一组成功完成了这个项目,另外两组在老师的进一步帮助下也完成了这个项目。虽然这个项目具有挑战性,但同学们对人工智能与艺术领域相结合充满了热情。

6月11日,三组学生展示了他们选择的人工智能项目。第一组展示了他们的2D凝视跟踪检测程序,该程序可以预测图像中的人正在看哪里。第一阶段对注视方向进行预测,生成多尺度注视方向场;然后将这些方向场与第二阶段的图像内容连接起来,并输入热图路径进行热图回归。下面是运行程序后的结果:

74D1

下一组演示了他们的钓鱼网站检测项目,该项目使用了随机森林算法。检测系统对url进行分析,输出1到-1之间的数字,1为安全网站,-1为钓鱼网站。

1345C

最后一组介绍了他们的3D人体姿态预估,通过使用视频姿态和形状预估方法,即视频推断身体姿态和形状估计(VIBE),他们的程序可以产生准确的自然运动影像。该技术利用大规模的运动捕捉数据集和对抗网络来训练判别器。以下是演示视频:

650DB4

E2CEAC

以上这些项目帮助同学们意识到了人工智能广泛的应用后,进一步激发了他们的兴趣,让他们对开发机器学习项目的过程有了更多的经验和亲切感,也在理论的理解和实施之上锻炼了更实际的应用,如用户界面设计以及如何作为一个团队高效协作。

此外,学生们还对机器学习背后的理论进行了深入的探索。他们开始学习了数学背景知识,如逻辑、线性代数和优化,然后探究了不同类别的机器学习算法,比如有监督学习算法如何基于已知数据对新数据进行分类或预测、无监督学习算法如何在不提供已知数据的情况下产生未知数据的信息以及强化学习算法在执行基于计算而选择的特定行为时如何适应来自环境的响应。他们还探索了神经网络的各种类型、架构和应用。

在这门课程之后,学生不仅在人工智能领域获得了一些理论基础,而且也将他们的知识应用于生活。有了这次体验,学生们有信心在人工智能这一内涵丰富的领域继续他们的旅程。

(文:胡文嘉、朱睿哲 图片、视频:胡文嘉、严斐琳、朱豫芝、徐一龙 指导教师:何天舟 审稿:左乾)