超出教室的数据科学

秋季2020发现展示视频

查看Discovery Showcase演示文稿:

BART,POWERSIDE,土着品牌

秋季2020展示发现突破室1

身体凸轮情绪,红线组动力学,蛋白质预测

秋季2020展示发现突破室2

2021年2月10日

在过去的五年中数据科学发现计划帮助数以百计的伯克利本科生加入数据科学研究项目。学生们在一个学期的一项学期工作,其中一项关于Discovery的项目合作伙伴的一项学期,它来自各种领域,包括伯克利教师,校园附属初创企业和非营利机构。研究项目利用数据科学技术解决现实问题。学生还可以获得课程信用,以获得他们参与发现计划的学位。以前的知名发现合作伙伴包括达拉斯市,国家航空航天局(美国宇航局)和联合国人道主义事务协调办公室(联合国OCHA)。

“我们希望帮助学生在广阔的数据科学世界中找到自己的位置,并为他们提供毕业后将获得回报的真实世界经验,”Discovery项目经理Arlo Malmberg说。“仅本学期,我们就与150多名学生一起参与43个项目,包括利用旧金山纪事报可视化自然灾害数据、利用机器学习预测BART的列车延误,以及利用自然语言处理向UCSF推荐个性化治疗计划。”

其中一个项目是为客户构建语言模型和自然语言处理(NLP)工具古代世界计算分析(AWCA)目标是从任何PDF集合创建引文网络。本学期,该团队正在微调以前的工作和在Jupyter笔记本中构建工作流。项目合作伙伴Adam Anderson博士认为,发现计划是“多层次参与”(从学生到教师)的绝佳机会享受会议的“不那么正式,更多的动手”方面,这让团队自由地互相学习。

另一个发现项目是改善旧金山纪事加州火灾追踪器,这是一张实时交互式地图,显示了野火和烟雾在该州的蔓延情况。“我们正在寻找更多实时更新的数据层来展示,我们需要集思广益,找出观众可能想要看到的层,并在线查找这些层的数据集,“这一学期的项目大学生之一,欧文张说。他目前正在致力于转换PM2.5(空气污染物)浓度到AQI(空气质量指数)并向地图添加火燃料层,使观众可以很容易地看到具有丰富干植被的区域(即将喂野火的区域)。

作为喜欢看地图的人,欧文喜欢了解创建数字地图背后的过程。该项目公开了大量地理信息系统(GIS)数据,虽然它可能会被压倒,但他发现它非常有趣。“真实数据科学的世界与我认为我的背景视为软件工程师/计算机科学家的背景不同,”欧文说。“人们往往认为这两个是高度相关的,而且它们是,但这两条工作线的挑战可能是非常不同的。”

学生可以预期从发现计划获得的一件事就是⁠⁠⁠⁠见证了“杂乱的数据,项目管理挑战,以及数据研究的意外发现”,Malmberg说。这些实践经验有助于许多发现学生造成巨大的实习和全职机会;Anna Burns的情况是谁是发现项目的学生领袖在家工作的葡萄酒专家(WAHVE)后来加入公司作为全日制初级数据科学家。

到本学年结束时,发现计划将使大约1000名学生在课堂之外参与数据科学项目⁠⁠. 发现只有在不断努力改善学生和研究项目合作伙伴的体验时,其影响力才会不断扩大⁠—该计划很快计划发布DiscoveryHub(一个JupyterHub),这样所有团队都可以通过一次点击访问GPU(图形处理单元)-启用Jupyter笔记本电脑,并正在为本科生开发一个令人兴奋的新的带薪实习计划

通过观看他们的展示演示,了解有关学生研究项目的更多信息:

秋季2020展示发现突破室1

秋季2020展示发现突破室2