永远从问题开始,而非数据。邓白氏集团首席数据科学家AnthonyScriffignano强调,数据科学不仅是运用一堆数据和分析工具,其核心价值在于用科学方法和数据,试图接近假设并回答重要的问题。


数据科学不是把一堆数据导入到算法和模型中,按下按钮,接着就等答案出来这么简单。

计算机科学技术出身的邓白氏集团首席数据科学家AnthonyScriffignano,深耕数据科学领域数十年,他强调数据科学不只是用一堆数据和分析工具,核心价值在于用科学方法和数据,试图接近假设并回答重要的问题。


摆脱工具迷思,数据科学家需具备扎实基本功,要问对问题

数据科学家要帮助客户实现目标,大数据只是实现目标的工具之一。

Scriffignano解释,科学背后的方法论来自于某种观察世界的角度,而根据观察发现问题后,才会开始制定研究方法、收集资料并尝试回答问题。


不过在商业上,人们常忽略制定问题的重要性,直接想如何应用数据,那么他们就得找出客户想应用数据的真正原因,把问题逐步拆解成比较容易解决的多个小问题来逐一突破

Scriffignano举例,曾有客户直接请邓白氏告诉他们中国有多少企业,但他们必须更深入追问,才不会让客户觉得有了想要的数据却达不到预期效果。例如,客户想在中国开拓新市场或让中国业务成长,需要的数据可能不同,又假设客户如果是船运公司,那代表他们只需要制造、运输产业的相关数据,而不需要餐厅、银行等其他产业的数据。


他再举例,业务成长过程中也会产生各种不同问题,例如:想获得更多客户,还是从现有客户赚更多钱,这是两个不同的问题,必须先厘清问题才能给出更好的答案。

因此作为一名数据科学家,Scriffignano认为,不仅要了解统计、拥有建模、机器学习等操作数据的能力,同样也要拥有足够广泛的商业知识,才能了解环境变化、制定问题,把大数据分析的结果具象化成故事。他举例,如果只是单纯处理数据,和数据科学的关联性会越来越弱,这就会变得好像一名只负责布置糖霜的烘焙师。


邓白氏集团首席数据科学家Anthony Scriffignano建议,有志大数据领域的人要保持谦虚,因为了解数据分析技术,并不代表了解所有商业知识。数据科学家不要只是和数据为伍、而是找到可以帮助的人。


从了解问题开始,大数据如何应用在金融科技

大数据可以应用在各个领域,金融科技(FinTech)就是其中一个受到一定影响的产业。举例来说,借贷公司透过大数据分析算出更精准的个人信用评级、提供小额借贷,又或者股票交易公司利用大数据找出市场可疑的股票操作行为。


正如Scriffignano指出,金融领域早在1950年代就开始应用科技,但FinTech这个词一直到近几年才出现,关键就是大数据崛起,在人人都有计算机和手机后,企业能收集大量个人数据,用户也期待能更快获得金融服务。


而从大数据分析衍生而来的机器人流程自动化(RPA),也是金融领域常见的应用之一。Scriffignano指出,根据帕累托最优法则,80%的建议都是常识,而这些是可以机器人发挥的地方,人脑则能用在回答更复杂、独特的问题。但和数据科学的核心价值一样,机器人需要了解问题,提供有意义的建议,否则“只能用更快的速度给出糟糕的建议”。


“如果你的目标是应用大数据,那需要换个目标。”回到数据科学,Scriffignano提醒:“永远从问题开始,而非数据。”否则,在这数据的汪洋大海中找到正解的难度,将不只是大海捞针,其难度将等同于在大海中捞一根特定的针。