课堂之外的数据科学

2020年秋季探索展示视频

浏览“探索之旅”专题报告:

BART, Powerside,本土品牌

2020秋季展柜探索突破室

身体摄像头情绪,Reddit群体动态,蛋白质预测

2020秋季展区探索突破2室

2021年2月10日

在过去的五年里数据科学发现项目帮助了数百名伯克利的本科生参与数据科学研究项目。在一个学期里,学生们与“发现”的一个项目合作伙伴一起进行一个基于团队的研究项目,该项目来自多个领域,包括伯克利的教员、校园附属的初创企业和非盈利机构。这些研究项目利用数据科学技术解决现实世界的问题。学生也可以通过参与探索项目获得学位学分。“发现号”之前著名的合作伙伴包括达拉斯市、美国国家航空航天局(NASA)和联合国人道主义事务协调办公室(UN OCHA)。

“我们希望帮助学生们在广阔的数据科学世界中找到自己的位置,并为他们提供现实世界的经验,这些经验将在他们毕业后带来回报,”探索公司的项目经理阿尔洛·马尔姆伯格(Arlo Malmberg)说。“仅本学期,我们就与超过150名学生开展了43个项目,其中包括《旧金山纪事报》(SF Chronicle)的自然灾害可视化数据、《BART》(BART)的机器学习预测火车晚点、以及与加州大学旧金山分校(UCSF)的自然语言处理建议的个性化治疗方案。”

一个这样的项目是建立语言模型和自然语言处理工具古代世界计算分析(AWCA)目标是从任何pdf集合中创建一个引用网络。本学期,团队正在对之前的工作进行微调在jupiter notebook中构建工作流。项目合作伙伴亚当·安德森博士发现,探索项目是“多层次参与”(从学生到教师)的绝佳机会享受会议的“不那么正式,更多的实践”方面,这允许团队自由地相互学习。

另一个探索项目是改进《旧金山纪事报》加州消防追踪,这是一个实时互动地图,显示全州野火和烟雾的蔓延情况。”我们正在寻找更多的实时更新的数据层来展示,这取决于我们对观众可能想要看到的层进行头脑风暴,并为这些层在网上找到数据集,本学期参加这个项目的本科生欧文·张(Owen Zhang)说。他目前正在研究PM2.5(空气污染物)浓度的转换到AQI(空气质量指数),并在地图上添加一个火-燃料层,这样观众就可以很容易地看到有丰富的干燥植被的地区(即,会引发野火的地区)。

作为一个喜欢看地图的人,Owen喜欢学习创建数字地图的过程。这个项目让Owen接触到很多地理信息系统(GIS)数据,虽然这可能会让他不知所措,但他觉得这很有趣。“真实的数据科学工作的世界与我作为软件工程师/计算机科学家的背景所看到的非常不同,”欧文说。“人们通常认为这两种工作高度相关,事实也确实如此,但这两种工作带来的挑战可能非常不同。”

Malmberg说,学生们可以期待从探索项目中获得的东西之一就是⁠⁠——亲眼目睹“数据研究带来的混乱数据、项目管理挑战和意外发现”。这些实践经验帮助许多“发现”的学生找到了很好的实习和全职机会;安娜·伯恩斯(Anna Burns)就是这样一个例子。她是“探索”项目的学生领袖在家工作复古专家(WAHVE)后来作为一名全职初级数据科学家加入了公司。

到本学年结束时,“发现”项目将在课堂之外将大约1000名学生与数据科学项目连接起来⁠⁠。Discovery的影响力和影响力只会随着它不断努力改善学生和研究项目合作伙伴的体验而增长⁠-该计划很快计划发布DiscoveryHub(一个JupyterHub),这样所有的团队都可以一键访问GPU(图形处理单元)目前,该公司正在为本科生开发一个令人兴奋的新带薪实习项目

通过观看他们的展示报告来了解更多关于学生研究项目的信息:

2020秋季展柜探索突破室

2020秋季展区探索突破2室