大工20秋《数据挖掘》大作业题目及要求

作者:周老师 分类: 大连理工 发布时间: 2020-11-24 21:04

专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等!

联系我们:QQ客服:3326650399   439328128    微信客服①:cs80188     微信客服②:cs80189

              扫一扫添加我为好友                           扫一扫添加我为好友

支付宝微信钱包

网络教学学院
《数据发掘》课 程 大 作 业

题 目:
姓 名:
学习中间:
榜首大题:叙述自己在完结大作业过程中遇到的艰难,处理疑问的思路,以及有关感触,或许对这个项意图知道,或许对Python与数据发掘的知道等等,300-500字。




第二大题:完结下面一项大作业标题。











2020秋《数据发掘》课程大作业
留意:从以下5个标题中任选其一作答。
标题一:Knn算法原理以及python完成
要 求:文档用运用word编撰即可。
首要内容有必要包含:
(1)算法介绍。
(2)算法流程。
(3)python完成算法以及预测。
(4)整个word文件名为 [名字 奥鹏卡号 学习中间](如戴卫东101410013979浙江台州奥鹏学习中间[1]VIP )
作业提交:
大作业上交时文件名写法为:[名字 奥鹏卡号 学习中间](如:戴卫东101410013979浙江台州奥鹏学习中间[1]VIP)
以附件方式上交离线作业(附件的巨细约束在10M以内),挑选已完结的作业(留意命名),点提交即可。如下图所示。


留意事项:
独立完结作业,禁绝抄袭其别人或许请人代做,如有相同作业,分数以零分计!

标题二:朴素贝叶斯算法原理以及python完成
要 求:文档用运用word编撰即可。
首要内容有必要包含:
(1)算法介绍。
(2)算法流程。
(3)python完成算法以及预测。
(4)整个word文件名为 [名字 奥鹏卡号 学习中间](如戴卫东101410013979浙江台州奥鹏学习中间[1]VIP )
作业提交:
大作业上交时文件名写法为:[名字 奥鹏卡号 学习中间](如:戴卫东101410013979浙江台州奥鹏学习中间[1]VIP)
以附件方式上交离线作业(附件的巨细约束在10M以内),挑选已完结的作业(留意命名),点提交即可。如下图所示。


留意事项:
独立完结作业,禁绝抄袭其别人或许请人代做,如有相同作业,分数以零分计!
标题三:SVM算法原理以及python完成
要 求:文档用运用word编撰即可。
首要内容有必要包含:
(1)算法介绍。
(2)算法流程。
(3)python完成算法以及预测。
(4)整个word文件名为 [名字 奥鹏卡号 学习中间](如戴卫东101410013979浙江台州奥鹏学习中间[1]VIP )
作业提交:
大作业上交时文件名写法为:[名字 奥鹏卡号 学习中间](如:戴卫东101410013979浙江台州奥鹏学习中间[1]VIP)
以附件方式上交离线作业(附件的巨细约束在10M以内),挑选已完结的作业(留意命名),点提交即可。如下图所示。


留意事项:
独立完结作业,禁绝抄袭其别人或许请人代做,如有相同作业,分数以零分计!

标题四:中华古诗词剖析
要 求:编写程序爬取中华古诗词网站
https://so.gushiwen.org/authors/上诗人的诗词信息,至少500首诗词,抽取诗词信息的诗人姓名、朝代、诗词标题、诗词内容存储在json文件中,自选某一视点完结对诗词的处理剖析。如:
(1)杜甫、李白的诗词用字、用词的比照剖析;
(2)唐宋代表性诗词的用词比照剖析;
(3)运用sklearn对不一样诗人的诗词进行练习,练习得到的模型能用于对诗词的作者的区分。比照不一样算法区分的精确率。
(4)整个word文件名为 [名字 奥鹏卡号 学习中间](如戴卫东101410013979浙江台州奥鹏学习中间[1]VIP )
作业提交:
大作业上交时文件名写法为:[名字 奥鹏卡号 学习中间](如:戴卫东101410013979浙江台州奥鹏学习中间[1]VIP)
以附件方式上交离线作业(附件的巨细约束在10M以内),挑选已完结的作业(留意命名),点提交即可。如下图所示。


留意事项:
独立完结作业,禁绝抄袭其别人或许请人代做,如有相同作业,分数以零分计!

标题五:歌词剖析
要 求:自选有音乐歌词的网站,编写爬虫程序下载不一样类型的歌曲歌词,至少3种以上类型,每品种型至少100首歌曲,抽取其间的歌曲称号、歌曲类型、歌词信息存储在json文件中,自选某一视点对歌词进行处理剖析。如:
(1)不一样类型的歌曲用词剖析,如下图所示(自行学习运用jieba库和wordcloud库的运用)。
(2)运用sklearn库对不一样类型的歌词进行练习,练习得到的模型能用于对歌词类型的区分。比照不一样算法区分的精确率。
(3)整个word文件名为 [名字 奥鹏卡号 学习中间](如戴卫东101410013979浙江台州奥鹏学习中间[1]VIP )
作业提交:
大作业上交时文件名写法为:[名字 奥鹏卡号 学习中间](如:戴卫东101410013979浙江台州奥鹏学习中间[1]VIP)
以附件方式上交离线作业(附件的巨细约束在10M以内),挑选已完结的作业(留意命名),点提交即可。如下图所示。


留意事项:
独立完结作业,禁绝抄袭其别人或许请人代做,如有相同作业,分数以零分计!

专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等!(非免费)

联系我们:QQ客服:3326650399   439328128    微信客服①:cs80188     微信客服②:cs80189

               扫一扫添加我为好友                           扫一扫添加我为好友

支付宝微信钱包