随着大数据、人工智能时代的到来,大学生毕业设计作品也与时俱进,爬虫和数据分析毕业设计项目无处不在,适合各行各业。例如,传媒大学毕业设计作品通过Python数据分析年所有类型节目数量占比情况,效果如图1所示。
图1
通过饼形图分析得知:真人秀类的节目占比最多,也就是最受欢迎的节目类型。实现这一分析结果主要使用了Python+Pyecharts图表,代码如下:
importpandasaspd#导入pyecharts模块frompyecharts.chartsimportPiefrompyechartsimportoptionsasopts#导入Excel文件df=pd.read_excel(data.xlsx)#按节目类型统计节目数量df_groupby=df.groupby(类别).size().reset_index()#使用Pyecharts绘制饼形图#x轴y轴数据x_data=df_groupby[类别]y_data=df_groupby[0]#饼形图用的数据格式是[(key1,value1),(key2,value2)],所以先使用zip函数将二者进行组合data=[list(z)forzinzip(x_data,y_data)]pie=Pie()#创建饼形图#为饼形图添加数据pie.add(series_name=类别,#序列名称data_pair=data)#数据pie.set_global_opts(title_opts=opts.TitleOpts(title="年所有类型节目数量占比分析饼状图",pos_left="center"),#饼形图标题居中#不显示图例legend_opts=opts.LegendOpts(is_show=False))#序列标签pie.set_series_opts(label_opts=opts.LabelOpts(),tooltip_opts=opts.TooltipOpts(trigger="item",formatter="{a}br/{b}:{c}({d}%)"))#渲染图表到HTML文件,存放在程序所在目录下pie.render("年所有类型节目数量占比分析饼状图.html")爬虫+数据分析的技能,还能干什么?在知乎中,我们看到很多小伙伴的“杰作”,有的同学爬取了Github热门项目.ICU中Issues页面的条讨论数据和条点了star的程序员Github个人信息数据。(本图来源于知乎)有的同学,看了《人间世》第二季第8集《儿科医生:坚守,还是逃离?》之后,爬取了丁香人才网条涵盖儿科、内科、外科、妇产科、眼科的招聘数据,并且分析儿科医生的真实处境。(本图来源于知乎)学会了数据分析和爬虫技能,你会发现,我们能做的、能分析的很多很多,而且当身边的事情被统计成为数据的时候,你才会对这件事有更深刻的认识。同样,这样的技能更是你未来立足社会的加分项,甚至会逐步成为人人必备的基本技能。如果你也想Get这种技能,小编推荐京东好评率超高的两本书↓↓↓全彩印刷,对新手非常友好,超高好评率,点击了解详情哦!End
目前+人已