Java软件开发者,如何学习大数据?
我觉得你这样问,应该是还想做和java相关的事情,不然不会提你是java程序员。所以,入门最好的是平台相关,去做一个大数据平台开发工程师。之后如果愿意学其他语言,去学scala,很多平台方面的组件是scala开发的,而且能更偏向数据逻辑。之后学python,这个时候就可以做数据挖掘,开始玩数据了。如果你的目标是玩数据,我建议你先学python和scala,毕竟你有java基础,学其他语言会很快。做挖掘、ai还是放弃java的好
樱桃味的可口可乐竟然是人工智能开发的?
虽然你是JAVA程序员…但作为任何程序员来说你的理解能力、自学能力和逻辑分析能力都是不错的…但你自己却找不到学习大数据的方法…你不觉得奇怪么?
是的…错误的开始推导出错误的结果…你应该怀疑你对大数据这个概念的认识…
1.大数据和云计算、物联网、人工智能都是一样的…就是一个概念…使用范围仅仅局限于PPT中…目的仅仅是触使已经信息化了的企业再买一套新的软件系统…而大数据正好就是一个卖点…作为卖点…能说出个hdfs spark等几个名词就足够了…原来怎么统计现在还怎么统计…你就和客户说你用了大数据…漫漫长夜…不值得为了节省那么几小时的统计时间费那么大功夫…
2.大数据分析师统计方法的选择也是让人不明所以的概念…为什么选择这种统计方法?然后就是你各种听不懂的解释…其实道理很简单…比如算收入增长率…你先问问领导他想要多少的收入增长率…比如8%…那你就用能算出8%的算法给他算…你算出别的数他肯定说你算的不准…大数据是辅助决策的工具而不是决策的工具懂么?你是给领导的决策提供有利的佐证…而不是指导他懂么?
3.盗亦有道…骗人也得像个样子…自然大数据也会出一堆工具打打幌子…你也应该知道大数据的工具好去招摇撞骗!大数据的根本是HDFS…也就是Hadoop的一个组件…其他两个组件MapReduce和Yarn看都不用看…学会怎么安装HDFS就够了…然后你要学Spark中的SparkSQL…还要会装HBase和Phoneix…没错就是用SQL做大数据计算…有人会说SQL比原生接口慢…MySQL也有原生接口啊…你看现在谁还用?慢是机器破的事…不是你的事…大数据的精髓就是横向扩展…速度不够机器来凑…买不起机器的公司还搞什么大数据…
4.半个月左右精通用SQL做大数据基本就够了…有闲心的话可以学学原生接口…最重要的还是1,2两点…创造效益是关键…不要拘于形式和工具…用mysql一样做大数据…