我为什么开设这个专栏
2016年 4月 5号经过一段时间的思考,我决定开一个技术、管理和团队的专栏,分享和探讨关于大数据、人工智能(AI)及机器学习(Machine Learning)的话题,以及这些相关技术的行业思考。在已经有不少优质内容(包括博客、微信公众号)的情况下,我希望这个专栏能够更加专注、专业,少一些关注个别技术的细节,多一些对数据在一个生态系统中的把握以及行业动态的分析。
在接下来的文章中,我准备着重分享和探讨如下这些方面的内容:
- 机器学习、人工智能和大数据相关领域的核心技术,如何应用这些核心技术到生产实践中。解析从单一算法到产品流程的距离和取舍(Compromise)。
- 什么是数据驱动(Data-Driven)的团队,如何构建具有核心竞争力的大数据团队。
- 如何设计和开发智能型数据驱动产品,作为产品经理,如何在产品功能和数据驱动之间寻求动态平衡。
正如前面提及的一样,第一方面已经有不少优秀内容涵盖。这个专栏的特色则是寻求如何在学术圈的最新研究成果(State-of-the-Art)和工业界的标准流程中建立桥梁,在浩如烟海的相关文献中,找到最适合的算法和模型。
第二和第三方面则是这个专栏重点想提及的部分。那就是如何转变现有的团队建设和产品开发思维,能够从数据驱动的角度,能够从数据工程的角度来看待问题。现代产品为什么失败,其中有一个原因就是没法和数据很好衔接。这里说的衔接,指的是产品功能上的衔接,数据链条的衔接以及产品经理的理念的衔接。这个专栏希望起到抛砖引玉的作用,能够真正引发对于数据产品的思考,推进产品的质量。
最后,为什么这个专栏叫“期望最大化”,这源自于一个机器学习里有名的算法:Expectation Maximization,不断在现有参数下更新模型对周围的认知然后又不断更新模型的参数,最终能够达到一个局部最优解。这个专栏也希望像这个算法一样,不断提升自己的认识,不求最完美,但求能够促进业界的分享和交流。