数据科学之路

 

从事数据分析行业已过三年,借鉴学习了很多大牛们的作品,一贯以来总想着整理总结自己在工作学习中的积累大概说是知识体系。但对于一个生活自律差的人来,大部分停留在脑海的边缘,时而想起痛苦,时而忘记回忆,终于在自己才华无法撑起自己的野心时,只有静下心来学习,才能慰勉自我,看清楚自己的未来。

作为开篇之作,我还是想以前人的总结和智慧之图,以此来描绘我的,你的,诸位立志从事数据科学的人们心中的疑虑和彷徨。

想必绘制此图的大神,定是一位温文尔雅、思维缜密的人,借此图为我们的数据科学之路导航。也祝这位大神平安健康,做你我数据科学远航途中永远的灯塔。

站在巨人的肩上,世界清晰了。下面是我结合活跃在各分享区的牛人们,以及自我数据实践总结出来的必备技能。

知识体系

  1. 学习线性代数、微积分、最优化、计算方法等,掌握计算推演能力;
  2. 概率论与数理统计中,掌握各类经典分布、假设检验、(非)参数估计、方差分析等知识;
  3. 机器学习中掌握常用的十大算法,算法原理,推演过程等;
  4. 深度学习中掌握感知机、BPNN、CNN、RNN、LSTM等理论;
  5. 逐步学习和掌握自然语言处理、语音识别、图像处理。

使用工具

  1. SQL能力,能够进行数据的增、删、改、查、汇总、简单ETL等;
  2. 核心武器之Python,掌握数据结构、函数、类;掌握常用库如scipy, pandas, MatplotLib,numpy,sklearn,...等;
  3. 核心武器之spark,熟练使用其进行各类的分布式机器学习;
  4. Linux,熟悉常用linux命令,熟练使用其进行数据分析,进行模型部署和自动调度;
  5. Tensorflow,最经典的机器学习框架,了解Tensorflow运行机制,灵活搭建常用模型和复杂模型。
  6. 其他工具如R、Scala、Java等。

落地实践

  1. 掌握实践方法论;如CRISP-DM,SEMMA,Tom Khabaza等
  2. 熟悉所属行业的业务模式,行业规范以及数据特点等;
  3. 具备实际业务场景的快速理解能力;如业务场景的流程和需求
  4. 具备实际业务中方案设计能力;如信贷关系中识别欺诈、高端客户流失预测等
  5. 具备对数据的好奇心和探索能力。

实践出真知,只有在更多的实践中,发现问题继而解决问题,才会真正将各个必备技能融会贯通。

大数据时代的到来,数据科学迅猛发展,掌握数据的往往是大型互联网、电商、金融、电信等企业,他们能够接触到相对前沿和亟待解决的数据挑战和技术难点,因此,学习和认知也不能闭门造车,要走出去,看世界,大概一切都会明朗起来。

借鉴警句,以此鞭策。

人一能之,己百之;人十能之,己千之。

分享到:

相关文章阅读:

  • 现在我们似乎总是会看见一些细思极恐的题目或者图片,今天就来看看这些恐怖的内涵图片,可能一开始看觉得没有什么,但是诡异图片看懂了
    科技之最最记录:3203
  • 生活中有太多事情是我们无法从科学角度解释的,所以每个人都可能会碰到灵异事件,明星自然也不例外,最典型的例子就是香港有位大明星在
    科技之最最记录:2978
  • 面具一般都是小孩子喜欢玩的东西,大部分都是看起来十分有趣的。但是有的面具却并非如此,毕竟一开始面具的出现就不单单只是玩具。有
    科技之最最记录:2907
  • 人们对于美食的追求总是胜过一切,毕竟吃才是最最享受的。特别是在法国,他们把美食当做高尚艺术来看待,法国菜更是作为世界三大料理有
    科技之最最记录:2707
  • 地球上80%被水覆盖着,人类历史的发展离不开水,特别是淡水是人类生存的根本之源,而河流是人类获取淡水的唯一途径,那么世界十大河流是
    科技之最最记录:2646
  • 世界上神秘的怪兽有很多,今天小编就来给大家说说其中的十类神秘怪兽,其中小编要重点提的泽西恶魔简直就是令人心惊胆寒,这样的怪物长
    科技之最最记录:2620
  • 科技之最排行(TOP10)