跳转至

yux-lab

01 模型选择

yux-lab

What's new?
AI
AI
- Deep Learning
  Deep Learning
  - Deep Learning from Scratch
    Deep Learning from Scratch
    
    Chapter 02 感知机
    Chapter 02 感知机
    
    第2章感知机
    
    Chapter 03 神经网络
    Chapter 03 神经网络
    
    第3章神经网络
    
    Chapter 04 神经网络的学习
    Chapter 04 神经网络的学习
    
    神经网络的学习
    
    Chapter 05 误差反向传播法
    Chapter 05 误差反向传播法
    
    误差反向传播法
  - Dive into Deep Learning
    Dive into Deep Learning
    
    Chap.03 线性神经网络
    Chap.03 线性神经网络
    
    3.1. 线性回归
    
    3.3. 线性回归的简洁实现
    
    3.4. softmax回归
  - Grokking Deep Learning
    Grokking Deep Learning
    
    Chapter 02 基本概念：机器如何学习
    Chapter 02 基本概念：机器如何学习
    
    基本概念：机器如何学习
    
    Chapter 03 神经网络预测导论：前向传播
    Chapter 03 神经网络预测导论：前向传播
    
    神经网络预测导论：前向传播
    
    Chapter 04 神经网络学习导论：梯度下降
    Chapter 04 神经网络学习导论：梯度下降
    
    4.1 预测、比较和学习
    
    Chapter 05 通用梯度下降：一次学习多个权重
    Chapter 05 通用梯度下降：一次学习多个权重
    
    Chapter 5 通用梯度下降：一次学习多个权重
  - D2l
    D2l
    
    08 线性回归 + 基础优化
    08 线性回归 + 基础优化
    
    01 线性回归
    
    02 基础优化算法
    
    03 线性回归的从零开始实现
    
    09 Softmax 回归
    09 Softmax 回归
    
    01 Softmax 回归
    
    02 损失函数
    
    10 多层感知机 + 代码实现
    10 多层感知机 + 代码实现
    
    01 感知机
    
    02 多层感知机
    
    11 模型选择 + 过拟合和欠拟合
    11 模型选择 + 过拟合和欠拟合
    
    01 模型选择 01 模型选择
    目录
    
    训练误差和泛化误差
    
    验证数据集和测试数据集
    
    K-则交叉验证
    
    总结
    
    02 过拟合和欠拟合
    
    12 权重衰退
    12 权重衰退
    
    01 权重衰退
    
    19 卷积层
    19 卷积层
    
    01 从全连接到卷积
Computer Science
Computer Science
- Algorithm
  Algorithm
  - Index
  - Readme
  - Hello 算法
    Hello 算法
    
    第 02 章复杂度分析
    第 02 章复杂度分析
    
    2.1 算法效率评估
    
    第 03 章数据结构
    第 03 章数据结构
    
    数据结构
    
    第 04 章数组与链表
    第 04 章数组与链表
    
    4.1 数组
    
    4.2 链表
    
    第 05 章栈与队列
    第 05 章栈与队列
    
    5.1 栈
    
    5.2 队列
    
    5.3 双向队列
    
    第 06 章哈希表
    第 06 章哈希表
    
    6.1 哈希表
    
    6.2 哈希冲突
    
    第 07 章树
    第 07 章树
    
    7.1 二叉树
    
    7.2 二叉树遍历
    
    7.3 二叉树数组表示
    
    第 08 章堆
    第 08 章堆
    
    8.1 堆
    
    8.2 建堆操作
    
    第 09 章图
    第 09 章图
    
    9.1 图
    
    第 10 章搜索
    第 10 章搜索
    
    10.1 二分查找
    
    第 11 章排序
    第 11 章排序
    
    11.1 排序算法
    
    11.2 选择排序
    
    11.3 冒泡排序
- How to eat course
  How to eat course
  - Terms
- Operating System
  Operating System
  - 2024 南京大学《操作系统：设计与实现》
    2024 南京大学《操作系统：设计与实现》
    
    01 操作系统概述 (操作系统的历史、学习操作系统的方法)
    
    Index
  - CSAPP
    CSAPP
    
    第01章计算机系统漫游
    第01章计算机系统漫游
    
    第一部分程序结构和执行
    第一部分程序结构和执行
    
    第01章计算机系统漫游
    
    第02章信息的表示和处理
    
    第03章程序的机器级表示
    
    第04章处理器体系结构
  - 汇编语言（第4版）
    汇编语言（第4版）
    
    第01章基础知识
    
    第02章寄存器
    
    第03章寄存器（内存访问）
- Programming Language
  Programming Language
  - C Programming
    C Programming
    
    Chapter 02 Basic Features of C
    Chapter 02 Basic Features of C
    
    Basic Features of C
    
    Chapter 03 Formatted Input Output
    Chapter 03 Formatted Input Output
    
    Formatted Input Output
    
    Chapter 05 Selection Statements
    Chapter 05 Selection Statements
    
    Selection Statements
    
    Chapter 06 Loops
    Chapter 06 Loops
    
    Loops
    
    Chapter 08 Arrays
    Chapter 08 Arrays
    
    Arrays
    
    Chapter 09 Functions
    Chapter 09 Functions
    
    Function
    
    Chapter 11 Pointers
    Chapter 11 Pointers
    
    Pointers
    
    Chapter 12 Pointers and Arrays
    Chapter 12 Pointers and Arrays
    
    Pointers and Arrays
    
    Chapter 13 Strings
    Chapter 13 Strings
    
    Strings
    
    Chapter 14 The Preprocessor
    Chapter 14 The Preprocessor
    
    The Preprocessor
    
    Chapter 15 Writing Large Programs
    Chapter 15 Writing Large Programs
    
    Writing Large Programs
    
    Chapter 16 Structures, Unions, and Enumerations
    Chapter 16 Structures, Unions, and Enumerations
    
    Structures, Unions, and Enumerations
    
    Chapter 17 Advanced Uses of Pointers
    Chapter 17 Advanced Uses of Pointers
    
    第 17 章指针的高级应用
    
    Chapter 19 Program Design
    Chapter 19 Program Design
    
    第 19 章程序设计
    
    习题笔记
    习题笔记
    
    Index
    
    Ch03
  - Linux C编程一站式学习
    Linux C编程一站式学习
    
    Index
    
    I. C语言入门
    I. C语言入门
    
    01. 程序的基本概念
    
    02. 常量、变量和表达式
    
    10. gdb
    
    II. C语言本质
    II. C语言本质
    
    18. x86汇编程序基础
Math
Math
- Calculus
  Calculus
  - 换元积分法
  - ch09 Differential Equations
    ch09 Differential Equations
    
    09.1 Modeling with Differential Equations
    
    09.2 Direction Fields and Euler’s Method
    
    Images
    Images
    
    09.2
  - ch11 Infinite Sequences and Series
    ch11 Infinite Sequences and Series
    
    01 Sequences
    
    02 Series
    
    03 The Integral Test and Estimates of Sums
    
    04 The Comparison Tests
    
    05 Alternating Series
    
    06 Absolute Convergence and the Ratio and Root Tests
    
    07 Strategy for Testing Series
    
    08 Power Series
    
    09 Representations of Functions as Power Series
    
    10 Taylor and Maclaurin Series
  - ch12 Vectors and Geometry of Space
    ch12 Vectors and Geometry of Space
    
    12 .5 Equations of Lines and Vectors
    
    The Cross Product
    
    The Dot Product
    
    Three Dimensional Coordinate Systems
    
    Vectors
    
    平面及其方程
  - ch13 Vector Functions
    ch13 Vector Functions
    
    13.1 Vector Functions and Space Curves
    
    13.2 Derivatives and Integrals of Vector Functions
    
    13.3 Arc Length and Curvature
  - 数学分析
    数学分析
    
    华东
    华东
    
    Chap. 12
    Chap. 12
    
    01 级数的敛散性
- Linear Algebra
  Linear Algebra
  - 线性代数（第5版） (Gilbert Strang (吉尔伯特·斯特朗）)
    线性代数（第5版） (Gilbert Strang (吉尔伯特·斯特朗）)
    
    第01章向量引论
    
    第02章求解线性方程组
Tools for anything
Tools for anything
- What's new?
- Command Manuals
  Command Manuals
  - Conda Commands
  - Git Commands
  - Jetson nano Commands
  - LaTex
  - Linux Commands
  - Powershell Commands
  - Vim Commands
  - Windows Terminal Commands
  - The Missing Semester of Your CS Education
    The Missing Semester of Your CS Education
    
    Lecture 1 Course overview + the shell
    
    Source

01 模型选择

训练误差和泛化误差

训练误差：模型在训练数据上的误差
泛化误差：模型在新数据上的误差
例子：根据模考成绩来预测未来考试分数
- 在过去的考试中表现很好（训练误差）不代表未来考试一定会好（泛化误差）
- 学生 A 通过背书在模考中拿到很好成绩
- 学生 B 知道答案后面的原因

验证数据集和测试数据集

验证数据集：一个用于评估模型好坏的数据集
- 例如拿出 50%的训练数据
- 不要跟训练数据混在一起（常犯错误）。也就是拿验证数据集来训练模型，从而使得更好的泛化能力。
- 验证数据集的精度不一定代表在新数据表现良好，因为验证集的精度也可能是通过超参数来调整的。
测试数据集：只用一次的数据集
- 未来的考试
- 不要拿测试集来调整模型的超参数，甚至跑了几百回拿最高精度的模型来表示 SOTA

K-则交叉验证

在没有足够多数据时使用
算法
- 将训练数据分割成 K 块
- For i = 1,..., k
  - 使用第 i 块作为验证数据集，其余的作为训练数据集
  - 循环，一直交换验证和训练数据集的块
- 报告 K 个验证集精度误差做平均
常用：K = 5 或 10；极端的情况下是：数据长度为 N，做 N 则交叉验证

总结

训练数据集：训练模型参数
验证数据集：选择模型超参数
非大型数据集上通常使用 k-折交叉验证