作为一个在大数据领域多年的从业者,接触过很多优秀的数据挖掘的同事。在和他们的交流中我也了解到了很多数据挖掘的从业之道。
要想成为一成功的数据挖掘专家职业的四个步骤:
步骤1:获得研究生以上的学历
在我接触过大厂的优秀的数据挖掘者中,几乎没有研究生一下学历的。
数据挖掘专家需要在数据科学以及业务管理方面有扎实的背景。相关的master学位包括计算机科学,数据科学,信息系统,统计和商业管理或任何相关领域。
你需要了解如何使用统计方法来分析数据,并且希望能够开发出预测模型。
数据挖掘专家必须能够将数据分析应用于实际的业务问题,因此开发商务智能的课程是出色的准备。
步骤2:先从简单的岗位开始
从简单的开始开始。如果毕业后没能找到一份理想的数据挖掘工作的话,你完全可以从数据分析师做起。先进入这个行业再说。
大学毕业后,寻找担任数据分析师的职位。这将使你进一步磨练技术技能,并对数据提取,转换和加载的过程有一个全面的了解。
你还需要牢牢掌握数据库设计等其他知识。
步骤3:熟练工具和修炼技能
熟悉数据分析工具,尤其是SQL,NoSQL,SAS和Hadoop,Spark
Java,Python\IPython
有Linux操作系统方面的经验。这些在IT领域都少不了的
熟练各种算法
真正了解一些算法比了解一些算法要好。 如果你非常了解线性回归,k均值聚类和逻辑回归,
可以解释和解释它们的结果,并且实际上可以从头到尾完成一个数据项目,那么你将比如果你知道每一个都更受雇 单一算法,但不能使用它们。
大多数时候,当你使用算法时,它将是库中的一个版本(你很少会编写自己的SVM实现-花费的时间太长)。
步骤4:多去实践
比如做一个股市预测的项目。看起来很困难,但仍然可以分解为一些小的可实施步骤。
我首先连接到yahoo finance API,并提取了每日价格数据。
然后,我创建了一些指标,例如过去几天的平均价格,并用它们来预测未来(请注意,这里没有真正的算法,只是技术分析)。
效果不是很好,所以我学习了一些统计数据,然后使用了线性回归。然后,我连接到另一个API,逐分钟收集数据,并将其存储在SQL数据库中。
依此类推,直到算法运行良好。
不仅可以让你学习SQL语法,还用它来存储价格数据,
没有应用程序的学习是不会很好地保留下来,也不会使你做好进行实际数据科学工作的准备。
最后,多投简历,多面试,多总结吧
以前有个同事刚开始做数据分析岗位,研究生读的是化学,所以基础都不好。那些算法啥的都是在做数据分析
后自学的。那时他想跳槽做数据挖掘之类的工作,毕竟工资会比数据分析高一些。看他每天都不停地投简历,
约面试。好长一段时间都没找到合适的工作,我都替他捏把汗。
最终还是有志者事竟成的找到一份满意的数据挖掘工作了。