自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

赖德发的博客

征途路上,星辰大海,交流微信:laidefa

原创 【python 走进NLP】两两计算相似度之后再按内容分组计算条数

# -*- encoding=utf-8 -*- import pandas as pd from itertools import permutations from text_anti_brush_function import * content_list=['东篱...

2019-04-25 18:27:06 1454 0

原创 【python 分组标记】python实现row_number功能

假设数据集data_101如下: content source_id max_similar 0 东篱 1 1.0 1 东篱 2 1.0 2 在么 3 1.0 ...

2019-04-25 18:21:15 1765 0

原创 【linux Anaconda 安装】linux下安装Anaconda教程

Anaconda 安装 1、下载一个linux 版本的Anacoda https://repo.continuum.io/archive/index.html 2、在下载的anaconda 安装包的目录下进行安装 bash Anaconda-2.1.0-Linux-x86_64.sh 3、验证...

2019-04-25 17:54:47 2769 0

原创 【python 走进NLP】搜索提示功能前缀字典树

站内搜索是一个网站的基本功能,一个好的搜索提示也能很好的提升用户体验,提高用户找到自己需要的东西的效率。下面基于字典树实现一个简单的中文前缀搜索提示功能。 用户输入的时候自动提示。 # -*- encoding=utf-8 -*- # 导入包 from pytrie impor...

2019-04-15 19:36:26 416 0

原创 【python 热更新】reload热更新代码,在其他模块动态改变变量

参考链接:https://blog.csdn.net/mouday/article/details/80814401 新建文件config1.py aaa=223 bbb=24 新建文件brush.py import time from importlib import reload whi...

2019-04-11 15:21:16 1115 0

原创 【python 平分切割】python切割数据成N等分,写入n个excel 文件

python切割数据成N等分,写入n个excel 文件 # -*- encoding=utf-8 -*- import pandas as pd import math lists = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10,11,12, 13,...

2019-04-10 20:19:02 3852 0

原创 【python 走进NLP】两两求相似度,得到一条文本和其他文本最大的相似度

应用场景: 一个数据框里面文本,两两求相似度,得到一条文本和其他文本最大的相似度。 content source_id 0 丰华股份军阀割据发生的故事大概多少w 1 1 丰华股份军阀割据发生的故事大概多少 2 2 丰华股份军阀割...

2019-04-11 11:11:24 539 0

提示
确定要删除当前文章?
取消 删除