第四届国家数据科学教育研讨会看着数学教学,为高中带来DS

2021年6月23日

爱游戏电竞UC Berkeley的数据科学本科学习计划继续培养全国各地高校数据科学教育的增长。由专门的采用团队领导,在计算,数据科学和社会的划分,许多机构都能够在建立当地计划方面模拟和适应伯克利的教育学。

这项努力的关键部分之一是托管教官年度研讨会。6月14日至18日之间,超过400名数据科学教练几乎遇到了伯克利的第四个国家数据科学教育研讨会分享成功故事,互相提供建议,并讨论如何使课程更适合学生。本次在线活动由计算、数据科学和社会部门协调,由微软和西方大数据创新中心赞助。

前两天展示了课外材料,以及UC Berkeley产品的理论和技术支撑。爱游戏电竞以下三天包括由来自全国各地的教授和教师组成的小组讨论组成。

今年的计划还包括关于几个新主题的面板讨论:在高中级别引入数据科学的势头,并对对数据科学感兴趣的学生进行误导。今年新的小组会议看着学校如何与地方政府和非营利机构合作,为学生提供现实世界,使用数据科学解决当地问题的实践经验。

将数据科学带入K-12

Zarek Drozda, a data science fellow at the U.S. Department of Education, opened the session on high school instruction by noting that the data science momentum in higher education has been building for five years, due in large part to the efforts at Berkeley, but it’s just starting to ratchet up in the K-12 grades.

斯坦福大学教育教授Jo Boaler,英格兰的数学教育前玛丽居里教授,目前正在共同领导K-12数据科学倡议,称为YouCubed。

“自1892年以来,我们一直在教导高中课程的内容,从那时起,高中的数学就会在此之前没有改变。我们实际上看到了高中数学的变化,“Boaler说,他是加利福尼亚州新数学框架的五名作家之一。“我们不仅在高中,我们将集中数据科学。”

Baaler表示,UC和Cal State Unirults Systems意致认为,UC和Cal State University Systems的努力非常有助于,数据科学和统计数据将被接受为代数2的替代品,因为Boaler表示。她认为与帮助驱动这一变化的博士抢劫咕噜声。

“This is amazing news partly because we’ve really only had one mathematics pathway for generations (calculus) that has dominated admissions, and that pathway is deeply inequitable,” Boaler said, adding that in order to meet the current high school calculus requirement, students need to be on the advanced math track by middle school, a decision schools make by sixth grade based on fourth-grade test scores.

“数据科学可以作为学生的公平选择,他们不必在中学进入或者在代数或几何中做得好,”Boaler说。“它将自己借给基于项目的方法,我们知道更多的学生。”

她引用了建模/跨学科比赛的2021年COMAP数学竞赛,其中三个应用了三个应用数学的本科生来模拟,发展,并传达了一个真实问题的解决方案。2月4日至6日的比赛中,47%的参与者和获奖者是年轻女性,而大多数数学比赛相比约有5%。重要的是,67%的参与者表示,经验改变了他们对未来途径的思考。

在北卡罗来纳州科学和数学学院,高中数学老师泰勒吉布森表示,更多的学生正试图进入数据科学和统计数据,称他们不想采取微积分。吉布森参加了第一个伯克利研讨会,在那里他了解了数据8,并认为“我打赌我们可以拉这一点。”

学校通过北卡罗来纳大学公开资助11级和12年级的学生。在达勒姆,680名学生住在校园里,另外400名参加在线课程。在秋季,更多学生将居住在Morganville Campus强调数据科学。

“数据8是我们的正确选择,”Gibson表示,因为数据科学计划呈现了一个干净的板岩。“我们要定义文化,”他说。“我们尽可能多地赠送”,“指的是公开的工具,书籍,评估等等。他说,最好的是,它并没有花费很多钱来开始。六十八名学生在过去的一年中占据了数据科学课的就职基础,21名入读学生明年要求它。学校还提供基于Berkeley数据100级的更高级课程。

吉布森说,在几位研讨会上呼应的主要挑战是寻找可以教导数据科学的教师。

帮助说服UC和CSU系统改变数学要求的古尔德,描述了国家科学基金会资助数据科学计划简介.由加州大学洛杉矶分校统计系于2012年开发,由该校计算机科学系和教育与信息科学系共同贡献,并与洛杉矶联合学区合作。

该计划的自由可用材料于2014年发布,大约同一时间加州实施了普通核心课程,这使得学校更具灵活性。Gould表示,目标不是关于学校的学生或成为数据科学家,而是帮助他们发展统计和计算思维,无论是一个公民责任和权利。“我们为每个人提供更强大的数据敏锐,”古尔德说。目前,15个学区正在使用该计划,若干国家教育部门,达到15,000名学生。

Gould提供了一些经验教训:

  • 关于学生如何了解数据的已知研究,返回大约30年。

  • 强调这个过程,而不是工具。这是关于解决问题,思考思考。

  • 在查看任何数据时,学生应该从根本上意识到扭曲。

  • 数据收集应使用不同的方法和数据类型,与学生充当人类传感器,以收集关于它们周围的过程的数据。

  • 制定编码技巧。

  • 协作,以学生为中心的学习,比讲座更好;让他们调查对他们重要的问题。

  • 为不了解内容的教师提供专业发展。特别是,与大多数数学课程不同,学生驱动的讨论可以迅速增长个人和/或政治,并且教师需要准备在没有疏远学生的情况下处理这些情况。

观看高中数据科学面板讨论。

数据科学中数学的愿景

6月19日车间小组更深入地深入了解数学课程如何与数据科学指导更好地对齐。数据科学的兴起作为一个研究领域已经导致重新评估数学途径,源于学生对线性代数的实践知识的需求。小组成员同意,数据科学有机会用实际的项目的示例取代数据科学的证据教学,使学生能够学习和理解潜在数学。

北卡罗来纳州戴维森学院的数学教授蒂姆文章是众所周知的,这是他在括号中的工作,艺术和科学预测哪个团队将赢得男女NCAA 3月疯狂锦标赛。他使用锦标赛来帮助学生了解分析,展示了解数据科学可能导致更准确的预测。当他在2011年首次作为家庭作业时,他的学生占400万预测的99.9%。最近,一名对篮球令人兴趣的学生最能预测来自当地Ben&Jerry的冰淇淋作为她的奖励。

“沉重的篮球迷实际上也不做,因为他们试图将数据过度充分实现他们的意见,这通常不是一个好主意,”图表说。

学生还涉及与其社区有关的项目,例如沿着夏洛特的主要道路绘制改良对边缘化社区的影响,或者帮助在学院农场种植的食物。

Charter表示,他鼓励学生在教室里思考数据,因为它有助于他们对数据发展良好的心态。这样,当他们被要求学习某些东西时,即使他们不知道如何去它,他们都有工具和信心开始思考解决方案。

在密歇根州西部的大谷州立大学,数学教授David Austin表示,该学校提供了一个没有数学级别的数据科学,而是需要计算机科学或统计课程。很少有学生正在使用微积分,而是偏爱线性代数。学校提供双程线性代数序列,并在第二课程中更加重视数据科学。奥斯汀说,该大学也达到了一所当地高中,一些学生在学校双重注册和“真正蓬勃发展”。“这是大学数学的第二个途径。”

次要需要一个最终的Capstone项目,其中学生团队使用真实数据与社区伙伴合作,清理它并可视化调查结果。项目包括附近盛大急流的历史上处于弱势地区的住房负担能力和优惠。

“他们真的看到数据是关于人,”奥斯汀说。“他们需要以一种让他们在调查结果的方式向非技术受众传达他们的发现。”

奥斯汀表示,目标是帮助学生看到故事中数学的价值,然后使用他们的培训来帮助创建模型,更好地了解数据。

“我们真的希望学生了解我们在做的一切后面有一些数学,无论是一种预测算法还是数据可视化,”统计教授从南加州罗莫纳学院的统计教授。“没有数学的数据科学不存在。”

在数学的坚定基础将有助于学生了解机器学习算法中发生了什么,即他们“不是某种神奇的东西”,Hardin说。这对于帮助他们构建模型并产生可重复的结果非常重要。数据科学家应该能够思考“流利的话,如果没有深刻地”关于模型背后的数学,他说这篇论文确保数学在数据科学世界中相关。“

在Berkeley,Gireeja Ranade是电气工程系和计算机科学系助理教授,重新设计了课程,在第一年推出线性代数。她通过向学生提出了主要概念,以提出Shazam应用程序和手机工作的原因。建立触摸屏怎么样?其他提示包括获取Netflix的建议,排名网站和培训深入学习神经网络?

“数学不仅仅是一些抽象的等式,而且与所有这些东西相连,他们可以变形地思考和互动,”Ranade说。“我们试图通过家庭作业问题向他们展示他们如何使用我们教导它们的数学概念来完成所有这些东西。”

事实上,两学期的序列Ranade开发了 - EECS 16A和16B:设计信息设备和系统I和II - 使用实践实验室给学生一个“抽象概念的有形感觉。在第一课程中,他们通过构建单像素摄像头来了解系统,然后通过构建自己的触摸屏并查看它可以检测到触摸来了解设计。作为对机器学习的介绍,他们从头开始创建自己的声学GPS,这导致“很多酷”的AHA!“时刻”,“Ranade说。

“我们试图让他们的全部管道数据科学家如何认为,第一,你必须从实际工作中收集数据,然后做一个模型和处理它,”她说,“然后你关闭循环通过信息和采取一个行动在现实世界中。”

观看数据科学会话的数学。

高中数据科学面板

Panel4 - 高中数据科学

数据科学面板数学

Panel8数据科学数学

2021车间页面