学校新闻
Girl's Programming Club是一个给喜欢和想要尝试编程的女生共同学习和交流的社团,社团活动以学生为主体开展。在2019学年第二学期,她们在社团指导何老师的帮助下,在线学习并实践了一系列有关Python爬虫的知识,社团成员受益匪浅。
Python是一个非常灵活,拥有很多模块、库和包的易于学习的高级编程语言。所谓“网络爬虫”指的是一种帮助程序员抓取互联网上各类信息的程序,可以用来收集和分析数据。在本学期,同学们学习了通过Python爬取图片,评论和排行等文字,以及从视频网站下载视频。不仅如此,同学们还通过爬虫制作了文字云,这种方式不仅可以有效地进行数据分析,同时创造绚丽的视觉效果。
在上半学期,大家首先学习了如何通过Python从网站上爬取图片,其中包括从多页的网页下载多张图片,例如从网站下载壁纸;从单页网页下载多张图片,例如从论坛下载图片;以及从多页的网站下载单张图片,例如下载一些电子读物。
从必应(bing.com)官网爬取壁纸的练习
在下半学期,同学们继续学习了从网站上爬取文字,主要学习和实践了从豆瓣等网站爬取书评、影评、书籍电影排行榜等的数据,并导出为txt和excel格式,还尝试了自动统计词语在一段文字中出现的频率,制作词云。
《西游记》中词语出现频率的统计词云练习
在学期末,大家还学习了如何用Python you-get库从各类视频网站下载mp4格式的视频。
社员们在一学期的社团活动中学习了许多有趣的内容,也希望对编程感兴趣的同学们可以加入他们一起享受编程的乐趣。
(文:郭中灵、朱颖瑄 图:郭中灵、朱颖瑄 指导教师:何天舟)