自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

赖德发的博客

征途路上,星辰大海,交流微信:laidefa

  • 博客(7)
  • 资源 (1)
  • 论坛 (1)
  • 收藏
  • 关注

原创 【python 走进NLP】两两计算相似度之后再按内容分组计算条数

# -*- encoding=utf-8 -*-import pandas as pdfrom itertools import permutationsfrom text_anti_brush_function import *content_list=['东篱','东篱','在么','在么','快回我','快回我','东篱','东篱','东篱','东篱','东篱','东篱']sou...

2019-04-25 18:27:06 1765

原创 【python 分组标记】python实现row_number功能

假设数据集data_101如下: content source_id max_similar0 东篱 1 1.01 东篱 2 1.02 在么 3 1.03 在么 4 1.04 快回我 ...

2019-04-25 18:21:15 2485

原创 【linux Anaconda 安装】linux下安装Anaconda教程

Anaconda 安装1、下载一个linux 版本的Anacodahttps://repo.continuum.io/archive/index.html2、在下载的anaconda 安装包的目录下进行安装bash Anaconda-2.1.0-Linux-x86_64.sh3、验证安装是否成功输入python 进行python环境4、删除anacondarm -rf ~/an...

2019-04-25 17:54:47 2938

原创 【python 走进NLP】搜索提示功能前缀字典树

站内搜索是一个网站的基本功能,一个好的搜索提示也能很好的提升用户体验,提高用户找到自己需要的东西的效率。下面基于字典树实现一个简单的中文前缀搜索提示功能。用户输入的时候自动提示。# -*- encoding=utf-8 -*-# 导入包from pytrie import StringTrie# 自定义字典树类class Suggester(object): def _...

2019-04-15 19:36:26 553

原创 【python 热更新】reload热更新代码,在其他模块动态改变变量

参考链接:https://blog.csdn.net/mouday/article/details/80814401新建文件config1.pyaaa=223bbb=24新建文件brush.pyimport timefrom importlib import reloadwhile True: import config1 reload(config1) ...

2019-04-11 15:21:16 1401

原创 【python 平分切割】python切割数据成N等分,写入n个excel 文件

python切割数据成N等分,写入n个excel 文件# -*- encoding=utf-8 -*-import pandas as pdimport mathlists = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10,11,12, 13, 14, 16, 17, 18, 19,20]length = len(lists)print(length)n...

2019-04-10 20:19:02 4775

原创 【python 走进NLP】两两求相似度,得到一条文本和其他文本最大的相似度

应用场景:一个数据框里面文本,两两求相似度,得到一条文本和其他文本最大的相似度。 content source_id0 丰华股份军阀割据发生的故事大概多少w 11 丰华股份军阀割据发生的故事大概多少 22 丰华股份军阀割据发生的故事大概多少 33 丰华股份军阀割据发生的故事大概多少 ...

2019-04-11 11:11:24 648

gbdt和xgboost算法详解

该文档详细介绍了机器学习算法中的GBDT和XGboost 两大神器

2018-01-24

开心果汁的留言板

发表于 2020-01-02 最后回复 2020-03-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除