让非数据科学家理解数据科学的价值
想想看:尽管人们对数据科学的兴趣激增,像这样的电影也很受欢迎《点球成金美国国家橄榄球联盟(NFL)和NBA继续回避分析。对于熟悉数据科学的人来说,这对游戏决策和花名册构建的潜在好处是显而易见的。但在非科技行业并非如此。
为什么?主要是因为数据科学还不是一个被广泛理解的术语。这两个词的组合让非stem人士产生了一种特殊的困惑(或许还有恐惧)。“数据”和“科学”让人联想起高中时复杂的数学和科学问题——这对大多数人来说不是愉快的回忆。
数据科学家的实际“工作”也不容易理解。考虑一下维基百科的定义:
“数据科学是一门跨学科的学科,涉及从各种形式的数据中提取知识或见解的科学方法、过程和系统,无论是结构化的还是非结构化的,类似于数据库中的知识发现(knowledge Discovery in Databases, KDD)。”
大多数人读到第五个单词后就会停止阅读。
而且,即使一家公司的高管们相信数据科学的力量,大多数员工可能也不熟悉它的好处。结果是孤立的数据科学团队,他们的建议经常被忽视(因为激励机制不一致)或被忽视(因为结果不可信)。
所有这些都意味着,一个刚刚开始职业生涯的数据科学家,在能够产生重大影响之前,可能需要说服同事相信她的分析的价值。
作为一个有经验的人,这里有一些建议可以帮助你有效地与周围的人共事:
承认现有框架是有价值的数据
人们普遍不信任那些能够“神奇地”解决长期存在的问题的局外人。消除这一问题的最佳方法是承认老前辈带来的历史上下文和数据。对数据科学能够实现的目标保持谦虚态度,但要展示数据驱动方法帮助实现类似目标的其他场景。
明确说明您不是来替换现有函数的
我遇到的一个常见误解是,数据科学将产生一个单一的答案,消除所有其他方法。我煞费苦心地解释了数据科学的局限性,并着重阐述了我的工作与现有方法的互补之处。
建立共同的目标
人们常常纠结于如何理解数据科学的重要性和为什么它重要。为了避免陷入关于数据科学方法论价值的毫无成效的辩论中,我试图关注我们正在努力实现的共同目标。我试图建立一个关于一个计划将如何影响团队或公司底线的共同理解,并利用它来确保团队的支持。
不要在一个孤立的数据科学团队工作。
许多公司会将他们的数据科学团队隔离到技术或工程部门,远离他们通常需要影响的商业决策。非集成数据科学团队的价值可能会受到更频繁的质疑。例如,每次团队向利益相关者提出建议时,他们都必须解释他们做什么,展示他们过去的成功,并说服人们相信他们的有用性。但一个由一到两名数据科学家组成的跨职能团队将已经熟悉数据科学流程,并将更好地准备实施建议。
寻找高能见度的项目
对于一个年轻的数据科学家来说,这似乎是违反直觉的建议。然而,一旦您通过高风险项目展示了您工作的价值,您就能够迅速说服人们实施您的建议。例如,在我开始现在的工作后不久,我创建了一个程序,利用机器学习技术帮助总结研究报告。我们公司的大多数人都被数以百计的研究报告淹没了。完成所有这些任务是一个非常耗时的过程。我的程序帮助筛选了这些报告中最重要的部分,这最终给整个公司带来了巨大的好处,也让我得到了关注。