学校新闻

编程社团学习和应用Python

2020年07月02日

Girl's Programming Club是一个给喜欢和想要尝试编程的女生共同学习和交流的社团,社团活动以学生为主体开展。在2019学年第二学期,她们在社团指导何老师的帮助下,在线学习并实践了一系列有关Python爬虫的知识,社团成员受益匪浅。

Python是一个非常灵活,拥有很多模块、库和包的易于学习的高级编程语言。所谓“网络爬虫”指的是一种帮助程序员抓取互联网上各类信息的程序,可以用来收集和分析数据。在本学期,同学们学习了通过Python爬取图片,评论和排行等文字,以及从视频网站下载视频。不仅如此,同学们还通过爬虫制作了文字云,这种方式不仅可以有效地进行数据分析,同时创造绚丽的视觉效果。

图片

在上半学期,大家首先学习了如何通过Python从网站上爬取图片,其中包括从多页的网页下载多张图片,例如从网站下载壁纸;从单页网页下载多张图片,例如从论坛下载图片;以及从多页的网站下载单张图片,例如下载一些电子读物。

图片

图片

图片

从必应(bing.com)官网爬取壁纸的练习

在下半学期,同学们继续学习了从网站上爬取文字,主要学习和实践了从豆瓣等网站爬取书评、影评、书籍电影排行榜等的数据,并导出为txt和excel格式,还尝试了自动统计词语在一段文字中出现的频率,制作词云。

图片

《西游记》中词语出现频率的统计词云练习

在学期末,大家还学习了如何用Python you-get库从各类视频网站下载mp4格式的视频。

社员们在一学期的社团活动中学习了许多有趣的内容,也希望对编程感兴趣的同学们可以加入他们一起享受编程的乐趣。

(文:郭中灵、朱颖瑄 图:郭中灵、朱颖瑄 指导教师:何天舟)