将数字转化为单词:关于数据科学的写作艺术

Sara Stoudt.

萨拉斯托德,史密斯学院统计及数据科学计划中的讲师

德纳兰

Deborah Nolan,院长院长本科学习和统计教授

2020年12月10日

爱游戏电竞UC Berkeley统计数据教授Deborah Nolan易于承认这对她来说很难。并根据她在30多年的教学中听到和看到的,大多数学生面临着同样的挑战。

几年前,她决定做点什么。她成功地申请了一家书面奖学金艺术,以便以书面形式教授统计数据。其中一个要求是与研究生共同设计课程。校园里的几个人推荐了Sara Stoudt,Ph.D.伯克利统计学生y,伙伴关系出生。

与数据进行沟通

除了开发课堂,诺兰和Stoudt共同撰写的“与数据进行沟通:数据科学的艺术”,一本书在2021年3月由牛津大学出版社出版。他们的文章“读写,”这提出了“学习统计讲故事艺术的框架”将出现在12月2日020重要性的重要性,英国皇家统计社会学报。

“我没想到教室关于写作或写一本书的课程,但似乎有一个无效,”诺兰说,院长,董事会在计算,数据科学和社会分工中的本科学习副院长。“我仍然发现很难编写,但它比曾经是少量痛苦。”

尽管如此,诺兰已经协调了五本关于统计数据和数据的书籍,并编辑了另外三本,并编写了63个期刊文章。

该项目将在伯克利春季2021学期期间全圈写数据故事将是数据88类系列中的数据科学连接器课程。Adam Anderson将成为教练。

走出关于数据的词

Stoudt现在是史密斯学院统计和数据科学计划的讲师,在那里她在数学中获得了学士学位,重点是统计数据。她说“这几天一切都是数据,重要的是能够解释为什么数据分析很重要。”

她在2019年在洛杉矶时报的数据桌上获得了一手进程。她开发了一个工具,将人口普查数据汇总到特定地区,记者感兴趣,然后在其报纸中使用该信息。爱游戏吧下载电脑版官方下载文章。

“作为回报,他们训练我像记者一样思考,”Stoudt说。“这一经历让我想到了很多关于我可以用统计数据做的事情。”

她说,写作统计数据的挑战之一是,她说,纪律具有非常具体的含义,非常具体的含义,类似于信心,意义和p值。

“写作需要忠于研究,但不是那么多,它让人们远离我们的工作,”SToudt说,谁也是一个伯克利数据科学研究院。“了解什么语言工作实践;没有很多关于野外统计数据的例子。我们希望学生意识到他们可以成为作者和统计名。”

Stoudt说,它也需要持续的注意力,并补充说,她的学生有时会打电话给她“当我在我的解释中获得邋”。“

但她甚至教学统计数据和数据科学生有关写作的事实仍然让她感到惊讶。

“我总是对我的写作自我意识 - 这是我最害怕的事情,”Stoudt承认。“我仍然有时认为'我如何教学写作?”。“

确定重要的是什么

诺兰表示,自20世纪90年代初以来,她一直在鼓励她的学生写作。在课程期间,学生将采取特定问题,在分析和解释中具有特定作用。这有助于他们确定重要的是,为他们发现的内容进行传达是重要的。写作可以是消费者指南的形式,对其主管的备忘录,或其他一些目标作品。

“重点是如何展示他们的分析,”诺兰说。“我想要更多技术写作支持,但在校园里找不到它。当我看到有机会教授写作研讨会的艺术时,我跳了起来。”

Nolan和Stoudt都说,教学学生的关键部分令人信服地说服他们在他们的写作中取得一个职位。诺兰说:“在技术论文中制作争论的想法并不是与数据科学家共同的。”“但是你需要把你的发现放在一个特定的光线中来说服读者工作的重要性。与此同时,你不能过度到达。”

Stoudt同意,补充说“我们需要学习我们可以而且不能说的。您还需要能够阐明为什么你喜欢某事或不喜欢它。”

阅读写作,或剥去洋葱

在他们的文章中,Nolan和Stoudt在重复阅读文章的重复读数中提供了“阅读写作”模板,在仔细阅读从开始完成后,每次都在寻找不同的东西。第一步是映射物品的组织并标记特定点,例如描述,图形和表格以及结论。第二步是识别统计元素,包括分析。最后一步是检查作者的论点,包括看他或她的言语以及如何支持或削弱这一论点。

“读一篇文章就像剥落洋葱,”诺兰说。“你必须多次去它来充分了解它。阅读,如写作,是一个迭代过程。”

当两人下来写下他们的书时,迭代是工作的关键部分。他们花在制定书写研讨会的月份提供了基础,他们花了大约一年时间来写第一稿。他们邀请了一个不同的同行群体阅读它,教授来自统计,英语,修辞和土木工程。

“召开这种审查小组的想法是尽可能少地发言,让他们负责,”诺兰说。“在他们的建议上,我们做了一个实质性的重写,消除了一些部分,重新​​排列了他人,增加了一个新的篇章并解释了我们在各个部分中的意思。

“当我们不可能想象做更多的工作时,我们知道这本书已经完成了,”诺兰说。

展望数据88:编写数据故事

亚当·安德森

在为即将到来的春季为即将到来的春季课堂上准备他的教学大纲,Anderson使用了一本书的提前副本,称之为“精彩,有用的指导”。他于2017年加入了爱游戏电竞UC Berkeley,作为伯克利数字人文的Mellon Proddocteral研究员,是数字人文学科和数据科学的讲师。

培训的语言学家,安德森将使用混合方法的课程方法。通常,数据科学家对最短的描述感兴趣,特别是在编码的时候,他说。在人文科学中,当谈到更详细时,答案是“是的,请。”

“肯定有两种不同的思想融合,”Anderson表示,他补充说他的通常的数据来源是古代文本,而不是数字。“我已经探索了许多不同的写作方式,他们都需要思考你的观众。”

无论是看篮球统计,说唱歌词还是Twitter饲料,都是量化的,Anderson说,并且很难把头缠绕在那个概念上。在即将到来的课堂上,学生将分析数字,然后将查找转换为常规语言。

“歌德写道,科学和艺术始于同样的事情,然后崩溃了,但总有一天会回到一起,”安德森说。“我想我们在那里,但我们不知道我们在那里。”

“能够教授这项本科生真是太棒了,向他们展示了不同观众的不同方式,”安德森说。“学会编写授权你发布你的研究,这有助于他人了解你的想法。”


1德语阅读:“ManVergaß,达·韦斯琴队Sich Aus Poesie Entwickelt Habe,Man Bedachte Nicht,Daß,Nach Einem Umschwung von Zeiten,Beide Sich Wieder Freundlich,Zu Beiderseitigem Vorteil,AufHöhererBetelle,Gar Wohl Wieder BegegnenKönnten”(歌德1817,493)