分析数据
步骤 确定:了解问题,确定问题 分解:分解问题和数据,使其成为更小的组成部分 评估:在前两步了解的情况作出各种结论 决策:把这些结论重新组合在一起,作出(建议)一个决策 确定问题 未明确确定⾃⼰的问题或⽬标就进⾏数据分析就如同未定下⽬的地就上路旅⾏⼀样。 客户将帮助你确定问题 客户是分析结果的服务对象。客户将根据你的分析做决策,你需要尽量从他那里多了解一些信息才能...
步骤 确定:了解问题,确定问题 分解:分解问题和数据,使其成为更小的组成部分 评估:在前两步了解的情况作出各种结论 决策:把这些结论重新组合在一起,作出(建议)一个决策 确定问题 未明确确定⾃⼰的问题或⽬标就进⾏数据分析就如同未定下⽬的地就上路旅⾏⼀样。 客户将帮助你确定问题 客户是分析结果的服务对象。客户将根据你的分析做决策,你需要尽量从他那里多了解一些信息才能...
准备 数据准备是分析、清理和转换数据的过程,使其可供建模和进行可视化。 数据准备是获取原始数据并将其转换为可理解且可信的信息的过程。 其中包括确保数据的完整性,纠正错误的数据,识别丢失的数据,将数据从一个结构转换为另一个结构或从一种类型转换为另一种类型,甚至使数据更易于读取等简单任务。 数据准备通常是一个漫长的过程。 数据分析师按照一系列步骤和方法来准备数据,以便将其放置到适当的上下文...
数据分析是标识、清除、转换和建模数据的过程,用于发现有意义和有用的信息。 然后通过报表将数据制作成故事进行分析,支持关键的决策过程。 分析的核心部分类别:说明性、诊断性、预测性、规范性、认知性 描述性分析 描述性分析有助于根据历史数据回答有关发生了什么的问题。 描述性分析技术汇总了大型语义模型,向利益干系人描述结果。 描述性分析的示例包括生成报表来提供组织销售和财务数据的视图。 通过...
实用技巧 Python 实用技巧 Asyncio 系列 1. 什么是 asyncio?如何基于单线程实现并发?事件循环又是怎么工作的? 2. 详解 asyncio 的协程、任务、future,以及事件循环 3. 详解 Socket(阻塞、非阻塞),以及和 asyncio 的搭配 4. 如何并发运行多个任务(asyncio.gather、asyncio.as_c...
创建项目 django-admin startproject <dir> <project_name> 启动项目 python manage.py runserver 创建应用 python manage.py startapp <app_name> 自动生成模型 python manage.py inspectdb > <...
安装环境 # 更新软件包列表 sudo apt update && sudo apt upgrade -y sudo add-apt-repository ppa:deadsnakes/ppa sudo apt update # 安装 Python 3 和 pip sudo apt install -y python3.12 python3.12 --version ...
在大部分现代操作系统中,已执行程序的代码在一个 进程(process)中运行,操作系统则负责管理多个进程。在程序内部,也可以拥有多个同时运行的独立部分。运行这些独立部分的功能被称为 线程(threads)。 Rust 标准库只提供了 1:1 线程模型实现。由于 Rust 是较为底层的语言,如果你愿意牺牲性能来换取抽象,以获得对线程运行更精细的控制及更低的上下文切换成本,你可以使用实现了 M...
三要素 设置需要的数据或状态 运行想要测试的代码 断言结果是否符合预期 执行命令 cargo test cargo test -- --test-threads=1 # 设置测试线程数 cargo test -- --show-output # 允许打印信息 cargo test <fn_name> # 测试指定用例 cargo test <condi...
智能指针是一种数据结构,其作用类似于指针,但也具有额外的元数据和功能。在引用和智能指针之间有一个额外的区别:虽然引用只借用数据,但在许多情况下,智能指针拥有它们所指向的数据。 智能指针实现了Deref和Drop特征。该Deref 特征允许智能指针结构的实例表现得像引用,因此可以编写代码以使用引用或智能指针。该Drop特征允许自定义当智能指针的实例超出范围时运行的代码。 Box<T&...
所有权是一组控制 Rust 程序如何管理内存的规则,rust 使用内存通过所有权系统进行管理,该系统具有一组编译器检查的规则。如果违反任何规则,程序将无法编译。 规则 Rust 中的每个值都有一个称为其 owner 的变量 一个值在同一时间只能有一个 owner 当 owner 变量超出作用域时,值会被销毁 数据存放 变量信息存放在堆(stack)中 值信...