Python数据分析的基本过程

一般来说,数据分析的基本过程包括以下几个步骤:1.提出问题——即我们所想要知道的指标(平均消费额、客户的年龄分布、营业额变化趋势等等)2.导入数据——把原始数据源导入Jupyter Notebook中(网络爬虫、数据读取等)3.数据清洗——数据清洗是指发现并纠正数据文件中可识别的错误(检查数据一致性,处理无效值和缺失值等)4.构建模型(高级的模型构建会使用机器学习的算法)5.数据可视化——matp...
2020/11/07   六月   2172

python 的海象运算符

python3.8中的新特性,":="符号assignment Expressions,翻译过来也就是赋值表达式,大家更普遍地称之为海象运算符。1. 第一个用法:if/else#if (age:= 20) > 18:    print("已经成年了")2. 第二个用法:w...
2020/10/30   六月   937

python函数定义中的冒号:和箭头->

Python3.5新增加的功能。因为Python不需要像Java一样,在函数定义中规定参数的类型,所以给程序员带来方便的同时,也增加了代码阅读的难度所以:通过冒号和箭头来表示这个参数的类型以及这个函数返回值的类型。冒号:官方叫做参数的类型建议符箭头:叫做函数返回值的类型建议符值得一提的是,既然都说是建议了,那么其实这个就算是违反了这个建议也不会报错。# 这两个函数完全等价,你的建议我并不...
2020/10/27   六月   1130

数据结构-树(六)

字典树,又称单词查找树,Trie 树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。注:定义来自百度百科。字典树的主要性质它有 3 个基本性质:根节点不包含字符,除根节点外每一个节点都只包含一个字符;从根节...
2020/10/27   六月   756

数据结构-树(五)

二叉搜索树又称二叉查找树,亦称二叉排序树,如下图所示:它主要用于搜索。 它或者是一棵空树,或者是具有下列性质的二叉树:若左子树不空,则左子树上所有结点的值均小于它的根结点的值;若右子树不空,则右子树上所有结点的值均大于它的根结点的值;左、右子树也分别为二叉排序树。平衡二叉树平衡二叉树(平衡二叉树又被称为 AVL 树 )是基于二分法的策略提高数据的查找速度的二叉树的数据结构。特点:平衡二叉树是采用二...
2020/10/24   六月   1034

数据结构-树(四)

删除节点存在 3 种情况,几乎所有类似博客都提到了这点。这 3 种情况分别如下:没有左右子节点,可以直接删除存在左节点或者右节点,删除后需要对子节点移动同时存在左右子节点,不能简单的删除,但是可以通过和后继节点交换后转换为前两种情况思路:先获取待删除节点 item 的父节点(以下简称 item)。    如果父节点不为空,判断 item 的左右子树是否存在:  &n...
2020/10/24   六月   930

二叉树、平衡二叉树、红黑树、B树、B+树与B*树

一、二叉树二叉查找树的特点就是左子树的节点值比父亲节点小,而右子树的节点值比父亲节点大二、平衡二叉树1、概念平衡二叉树是基于二分法的策略提高数据的查找速度的二叉树的数据结构。2、规则平衡二叉树是采用二分法思维把数据按规则组装成一个树形结构的数据,用这个树形结构的数据减少无关数据的检索,大大的提升了数据检索的速度;平衡二叉树的数据结构组装过程有以下规则:①非叶子节点只能允许最多两个子节点存在。②每一...
2020/10/24   六月   846

数据结构-树(三)

如何储存二叉树储存二叉树有俩种方法,一是基于指针和引用的二叉链式储存法,一种是基于数组的顺序储存法1 二叉链式储存法这个比较简单,我们从图中可以看出,每个节点除了储存数据,还储存了左右子节点的指针,我们只要拿到根节点,就可以把整个树串起来2 顺序储存法我们把根节点储存在下标i=1的位置,那么左子节点储存在下标2 * i = 2的位置,右子节点储存在下标2 * i + 1 = 3的位置,由此类推,B...
2020/10/24   六月   962

数据结构-树(二)

二叉树特点  由二叉树的定义,以及图中所示的二叉树的分析可以得出二叉树具有以下几个特点:  (1)每个节点最多有两颗子树,所以二叉树中不存在度大于2的节点。  (2)左子树和右子树是有顺序的,次序不能任意颠倒。  (3)即使树中某节点只有一棵子树,也要区分它是左子树还是右子树。二叉树性质  (1)在二叉树的第i层上最多有2i-1 个节点 。(i>=1)  (2)二叉树中如果深度为k...
2020/10/24   六月   835

数据结构-树(一)

树是一种抽象数据类型或是实现这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它是由n(n>0)个有限节点组成一个具有层次关系的集合。树具有以下特点:每个节点都只有有限个子节点或无子节点没有父节点的节点称为根节点每一个非根节点有且只有一个父节点除了根节点外,每个子节点可以分为多个不相交的子树树里面没有环路(cycle)树还有一些专用的术语和概念,我们通过下边这个图为例来说明。节...
2020/10/24   六月   828