数据100:数据科学的原理和技术

data100fall19.

数据100,2019秋季

数据100中的学生探索数据科学生命周期,包括问题配方,数据收集和清洁,探索性数据分析和可视化,统计推断和预测以及决策。该课程侧重于定量批判性思维和执行此循环所需的关键原则和技术。这些包括用于转换,查询和分析数据的语言;机器学习方法的算法包括回归,分类和聚类;创建信息性数据可视化背后的原则;测量误差和预测的统计概念;和可扩展数据处理的技术。

班级对符合先决条件的所有专业和水平的学生开放。它在数据科学(数据8)的基础之间桥梁和上部计算机科学和统计课程以及其他领域的方法课程。它还用作数据科学专业的上部核心类。

在班级的试点提供,入学人数仅限于98名学生。该课程在2017年秋季广泛开放。

先决条件 -教师需要以下(或等价物):

  1. 数据科学基础:数据8.涵盖数据100中的大部分材料,但在介绍程度上。数据8提供基本接触Python编程,并使用表格数据以及可视化,统计和机器学习。

  2. 计算:计算机程序的结构和解释,CS61A,数据科学中的计算结构,CS88., 或者Introduction to Computer Programming for Scientists and Engineers, ENGIN 7. These courses provide additional background in programming (e.g., for-loops, lambdas, debugging, and complexity) that will enable Data 100 to focus more on the concepts in Data Science and less on the details of programming in python.

  3. 数学:线性代数(数学54.stat 89a., 或者ee 16a.):我们将需要一些基本概念,如线性运算符,特征向量,衍生物和积分,以实现统计推断和推导新的预测算法。这可以同时满足数据100,但课程人员强烈建议在注册数据100之前完成线性代数。

在数据8之后对附加数据科学课程感兴趣的学生,但尚未满足数据100要求现在应该采取先决条件,以便他们可以在未来的学期中获取数据100。此处列出了其他数据科学类://www.gmr-search.com/education/courses.

要了解有关数据100的更多信息,请访问课程网站 http://www.ds100.org.

数据100概述

数据100:数据科学的原理和技术