跳转至

yux-lab

01 Softmax 回归

yux-lab

What's new?
AI
AI
- Deep Learning
  Deep Learning
  - Deep Learning from Scratch
    Deep Learning from Scratch
    
    Chapter 02 感知机
    Chapter 02 感知机
    
    第2章感知机
    
    Chapter 03 神经网络
    Chapter 03 神经网络
    
    第3章神经网络
    
    Chapter 04 神经网络的学习
    Chapter 04 神经网络的学习
    
    神经网络的学习
    
    Chapter 05 误差反向传播法
    Chapter 05 误差反向传播法
    
    误差反向传播法
  - Dive into Deep Learning
    Dive into Deep Learning
    
    Chap.03 线性神经网络
    Chap.03 线性神经网络
    
    3.1. 线性回归
    
    3.3. 线性回归的简洁实现
    
    3.4. softmax回归
  - Grokking Deep Learning
    Grokking Deep Learning
    
    Chapter 02 基本概念：机器如何学习
    Chapter 02 基本概念：机器如何学习
    
    基本概念：机器如何学习
    
    Chapter 03 神经网络预测导论：前向传播
    Chapter 03 神经网络预测导论：前向传播
    
    神经网络预测导论：前向传播
    
    Chapter 04 神经网络学习导论：梯度下降
    Chapter 04 神经网络学习导论：梯度下降
    
    4.1 预测、比较和学习
    
    Chapter 05 通用梯度下降：一次学习多个权重
    Chapter 05 通用梯度下降：一次学习多个权重
    
    Chapter 5 通用梯度下降：一次学习多个权重
  - D2l
    D2l
    
    08 线性回归 + 基础优化
    08 线性回归 + 基础优化
    
    01 线性回归
    
    02 基础优化算法
    
    03 线性回归的从零开始实现
    
    09 Softmax 回归
    09 Softmax 回归
    
    01 Softmax 回归 01 Softmax 回归
    目录
    
    回归 vs 分类
    
    从回归到多类分类
    
    从回归到多类分类 - 均方损失
    
    One-Hot Encoding
    
    Softmax 和交叉熵损失
    
    1. Softmax 函数
    
    2. 交叉熵损失
    
    02 损失函数
    
    10 多层感知机 + 代码实现
    10 多层感知机 + 代码实现
    
    01 感知机
    
    02 多层感知机
    
    11 模型选择 + 过拟合和欠拟合
    11 模型选择 + 过拟合和欠拟合
    
    01 模型选择
    
    02 过拟合和欠拟合
    
    12 权重衰退
    12 权重衰退
    
    01 权重衰退
    
    19 卷积层
    19 卷积层
    
    01 从全连接到卷积
Computer Science
Computer Science
- Algorithm
  Algorithm
  - Index
  - Readme
  - Hello 算法
    Hello 算法
    
    第 02 章复杂度分析
    第 02 章复杂度分析
    
    2.1 算法效率评估
    
    第 03 章数据结构
    第 03 章数据结构
    
    数据结构
    
    第 04 章数组与链表
    第 04 章数组与链表
    
    4.1 数组
    
    4.2 链表
    
    第 05 章栈与队列
    第 05 章栈与队列
    
    5.1 栈
    
    5.2 队列
    
    5.3 双向队列
    
    第 06 章哈希表
    第 06 章哈希表
    
    6.1 哈希表
    
    6.2 哈希冲突
    
    第 07 章树
    第 07 章树
    
    7.1 二叉树
    
    7.2 二叉树遍历
    
    7.3 二叉树数组表示
    
    第 08 章堆
    第 08 章堆
    
    8.1 堆
    
    8.2 建堆操作
    
    第 09 章图
    第 09 章图
    
    9.1 图
    
    第 10 章搜索
    第 10 章搜索
    
    10.1 二分查找
    
    第 11 章排序
    第 11 章排序
    
    11.1 排序算法
    
    11.2 选择排序
    
    11.3 冒泡排序
- How to eat course
  How to eat course
  - Terms
- Operating System
  Operating System
  - 2024 南京大学《操作系统：设计与实现》
    2024 南京大学《操作系统：设计与实现》
    
    01 操作系统概述 (操作系统的历史、学习操作系统的方法)
    
    Index
  - CSAPP
    CSAPP
    
    第01章计算机系统漫游
    第01章计算机系统漫游
    
    第一部分程序结构和执行
    第一部分程序结构和执行
    
    第01章计算机系统漫游
    
    第02章信息的表示和处理
    
    第03章程序的机器级表示
    
    第04章处理器体系结构
  - 汇编语言（第4版）
    汇编语言（第4版）
    
    第01章基础知识
    
    第02章寄存器
    
    第03章寄存器（内存访问）
- Programming Language
  Programming Language
  - C Programming
    C Programming
    
    Chapter 02 Basic Features of C
    Chapter 02 Basic Features of C
    
    Basic Features of C
    
    Chapter 03 Formatted Input Output
    Chapter 03 Formatted Input Output
    
    Formatted Input Output
    
    Chapter 05 Selection Statements
    Chapter 05 Selection Statements
    
    Selection Statements
    
    Chapter 06 Loops
    Chapter 06 Loops
    
    Loops
    
    Chapter 08 Arrays
    Chapter 08 Arrays
    
    Arrays
    
    Chapter 09 Functions
    Chapter 09 Functions
    
    Function
    
    Chapter 11 Pointers
    Chapter 11 Pointers
    
    Pointers
    
    Chapter 12 Pointers and Arrays
    Chapter 12 Pointers and Arrays
    
    Pointers and Arrays
    
    Chapter 13 Strings
    Chapter 13 Strings
    
    Strings
    
    Chapter 14 The Preprocessor
    Chapter 14 The Preprocessor
    
    The Preprocessor
    
    Chapter 15 Writing Large Programs
    Chapter 15 Writing Large Programs
    
    Writing Large Programs
    
    Chapter 16 Structures, Unions, and Enumerations
    Chapter 16 Structures, Unions, and Enumerations
    
    Structures, Unions, and Enumerations
    
    Chapter 17 Advanced Uses of Pointers
    Chapter 17 Advanced Uses of Pointers
    
    第 17 章指针的高级应用
    
    Chapter 19 Program Design
    Chapter 19 Program Design
    
    第 19 章程序设计
    
    习题笔记
    习题笔记
    
    Index
    
    Ch03
  - Linux C编程一站式学习
    Linux C编程一站式学习
    
    Index
    
    I. C语言入门
    I. C语言入门
    
    01. 程序的基本概念
    
    02. 常量、变量和表达式
    
    10. gdb
    
    II. C语言本质
    II. C语言本质
    
    18. x86汇编程序基础
Math
Math
- Calculus
  Calculus
  - 换元积分法
  - ch09 Differential Equations
    ch09 Differential Equations
    
    09.1 Modeling with Differential Equations
    
    09.2 Direction Fields and Euler’s Method
    
    Images
    Images
    
    09.2
  - ch11 Infinite Sequences and Series
    ch11 Infinite Sequences and Series
    
    01 Sequences
    
    02 Series
    
    03 The Integral Test and Estimates of Sums
    
    04 The Comparison Tests
    
    05 Alternating Series
    
    06 Absolute Convergence and the Ratio and Root Tests
    
    07 Strategy for Testing Series
    
    08 Power Series
    
    09 Representations of Functions as Power Series
    
    10 Taylor and Maclaurin Series
  - ch12 Vectors and Geometry of Space
    ch12 Vectors and Geometry of Space
    
    12 .5 Equations of Lines and Vectors
    
    The Cross Product
    
    The Dot Product
    
    Three Dimensional Coordinate Systems
    
    Vectors
    
    平面及其方程
  - ch13 Vector Functions
    ch13 Vector Functions
    
    13.1 Vector Functions and Space Curves
    
    13.2 Derivatives and Integrals of Vector Functions
    
    13.3 Arc Length and Curvature
  - 数学分析
    数学分析
    
    华东
    华东
    
    Chap. 12
    Chap. 12
    
    01 级数的敛散性
- Linear Algebra
  Linear Algebra
  - 线性代数（第5版） (Gilbert Strang (吉尔伯特·斯特朗）)
    线性代数（第5版） (Gilbert Strang (吉尔伯特·斯特朗）)
    
    第01章向量引论
    
    第02章求解线性方程组
Tools for anything
Tools for anything
- What's new?
- Command Manuals
  Command Manuals
  - Conda Commands
  - Git Commands
  - Jetson nano Commands
  - LaTex
  - Linux Commands
  - Powershell Commands
  - Vim Commands
  - Windows Terminal Commands
  - The Missing Semester of Your CS Education
    The Missing Semester of Your CS Education
    
    Lecture 1 Course overview + the shell
    
    Source

01 Softmax 回归

Softmax 回归是一个分类问题

回归 vs 分类

回归估计一个连续值（房价预测）
分类预测一个离散类别（物品分类）

连续值是指可以在一定范围内取任意值的变量。离散类别是指变量只能取有限的几个特定值

从回归到多类分类

从回归到多类分类 - 均方损失

在分类不关心实际的值，关心的是：是否对正确类别的置信度特别大，将真正的类和不一样的类区分开；希望输出是一个概率

对类别进行一位有效编码
使用均方损失训练
最大值最为预测

One-Hot Encoding

One-Hot Encoding 是一种将分类变量（例如文本标签）转换成数值形式的技术。
在 One-Hot Encoding 中，每个类别都会被表示为一个独立的二进制变量（或位），其中只有一个位是激活状态（通常是1），其余位都是非激活状态（通常是0）。
这种编码方式能够将分类数据转换为机器学习算法更容易处理的形式。
例如，如果有三个类别 A, B, C，那么标签 A 将编码为 [1, 0, 0]，标签 B 将编码为 [0, 1, 0]，标签 C 将编码为 [0, 0, 1]。

Softmax 和交叉熵损失

交叉熵常用来衡量两个概率区别

1. Softmax 函数

Softmax 函数是一个常用的激活函数，用于将一个向量转换为概率分布。它经常被用于多类分类任务的输出层，使得每个类别的输出可以被视为属于该类的概率。

2. 交叉熵损失

交叉熵损失（Cross-Entropy Loss）是一种衡量预测概率分布与真实概率分布之间差异的损失函数。在多类分类任务中，它通常用于评估模型预测的概率分布与实际标签之间的差距。

损失函数（Loss Function）是机器学习和深度学习中非常重要的概念之一。它用于量化模型预测与真实标签之间的差异，是模型训练过程中优化目标的核心组成部分。通过最小化损失函数，我们可以调整模型的参数，使其更好地拟合训练数据。