2019年西南财经大学大数据管理专业真题回忆(817)

本站小编 Free考研网/2019-05-28

一,名词解释:5*5分
半监督学习,决策树,关联规则,贝叶斯(大纲没要求),自然语言处理
二,简答题5*20分
1.详细的题干是:假定你是Big-University 的软件工程师,任务是设计一个数据挖掘系统,分析学学校课程 数据库。该数据库包括如下信息:每个学生的姓名地址和状态(例如,本科生或研究生)所修课程,以及他们的GPA。描述你要选取的结构,该结构的每个成分的作用是什么?给了一个关于课程的数据库,包括学生信息,课程信息,GPA等数据。设计数据挖掘过程,选择什么结构(这题没看懂让干啥)
2.课本上关于年龄的那个课后题最低13,最高70,有27个数的那个题。找出离群点,写出光滑数据的方法
3.写三种处理缺失值的方法
4.少量数据在高密度的区域,大量数据在低密度的区域,使用基于密度的方法只能识别出高密度的区域。这是对这种方法的合理使用吗?如何改进?
5.简述基于密度的聚类方法
三,编程计算题25分
写出将N个自然数有序排列的算法思路,并写出任意一种语言的具体程序


我对题型不一样是有心理准备的,去年就不一样。没想到有些题会和大纲也不一样。如果你打算考,希望你有心理准备。

相关话题/课程 数据 结构 信息 数据库