自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

赖德发的博客

征途路上,星辰大海,交流微信:laidefa

  • 博客(10)
  • 资源 (1)
  • 论坛 (1)
  • 收藏
  • 关注

原创 【java 走进NLP】simhash 算法计算两篇文章相似度

python 计算两篇文章的相似度算法simhash见:https://blog.csdn.net/u013421629/article/details/85052915对长文本 是比较合适的(超过500字以上)下面贴上java 版本实现:pom.xml 加入依赖<dependency> <groupId>org.jsoup</groupId>...

2018-12-17 18:08:56 1650 3

原创 【python 走进NLP】simhash 算法计算两篇文章相似度

SimHash算法simhash算法的主要思想是降维,将高维的特征向量映射成一个f-bit的指纹(fingerprint),通过比较两篇文章的f-bit指纹的Hamming Distance来确定文章是否重复或者高度近似。主要分以下几步:1、抽取文本中的关键词及其权重。2、对关键词取传统hash,并与权重叠加,算出文本的fingerprint值。3、计算出两个文本之间fingerprin...

2018-12-17 17:37:38 4204

原创 【python 走进NLP】文本相似度各种距离计算

主要内容:1. 余弦相似度2. 欧氏距离3. 曼哈顿距离4. 切比雪夫距离5. 杰尔德距离6. 汉明距离7. 标准化欧式距离8. 皮尔逊相关系数# -*- coding:utf-8 -*-import numpy as npfrom scipy.spatial.distance import pdist# 余弦相似度def cos_dist(vec1,vec2)...

2018-12-17 15:33:04 1281 1

原创 【python 走进NLP】句子相似度计算--余弦相似度

余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值,绘制到向量空间中,如最常见的二维空间。# -*- coding: utf-8 -*-import jiebaimport numpy as npdef get_word_vector(s1,s2): """ :param s1: 句子1 :pa

2018-12-17 11:05:18 7705 1

原创 【python 图片搜索】python 快速计算两个图片的相似度

一、图片相似度检测算法原理我们日常中处理的数据大多数是文本和图片,既然文本有文本相似度,图片肯定也有图片相似度呀,是不是。下面介绍图片相似度检测的算法:检查两个图片的相似度,一个简单而快速的算法:感知哈希算法(Perceptual Hash),通过某种提取特征的方式为每个图片计算一个指纹(哈希),这样对比两个图片相似与否就变成了对比两个指纹异同的问题。二、实现步骤和思路Step1.缩小尺寸...

2018-12-14 18:05:07 4203 3

原创 【python 图片识别】python识别图片是不是包含二维码

近几天在研究二维码的识别,主要是通过python代码来识别特定图片内是否包含二维码。方法有分类,还有下面我介绍的直接法。需要安装库pip install pyzbar pip install opencv-python我们 先准备些二维码总共有11个二维码。下面我们进行二维码识别:# -*- coding: utf-8 -*-import osfrom pyzbar.py...

2018-12-06 15:49:56 5054 3

原创 【python 文件操作】shutil模块和OS模块

总结os包: rmdir, mkdir, listdir, remove, rename, chmod, chown, stat, symlinkshutil包: copy, moveos包os包包括各种各样的函数,以实现操作系统的许多功能。这个包非常庞杂。os包的一些命令就是用于文件管理。我们这里列出最常用的:mkdir( path )创建新目录,path为一个字符串,表示新目录的路...

2018-12-05 13:11:17 228

原创 【python pytorch】Pytorch实现逻辑回归

pytorch 逻辑回归学习demo:import torchimport torch.nn as nnimport torchvision.datasets as dsetsimport torchvision.transforms as transformsfrom torch.autograd import Variable# Hyper Parameters input_...

2018-12-04 19:51:11 529

原创 【python pytorch】Pytorch 基础知识

包含知识点:张量数学操作数理统计比较操作#-*-coding:utf-8-*-import numpy as npnp.set_printoptions(suppress=True)import torch# 构造一个4*5 的矩阵z=torch.Tensor(4,5)print(z)# 两个矩阵进行加法操作y=torch.rand(4,5)print(...

2018-12-03 19:42:30 573

原创 【python pytorch】windows 10 深度学习框架pytorch安装

Python3.5+pip安装cpu版本pip install http://download.pytorch.org/whl/cpu/torch-0.4.0-cp35-cp35m-win_amd64.whlpip install torchvisionPython3.6+pip安装cpu版本pip install http://download.pytorch.org/whl/cpu...

2018-12-03 11:54:52 610

gbdt和xgboost算法详解

该文档详细介绍了机器学习算法中的GBDT和XGboost 两大神器

2018-01-24

开心果汁的留言板

发表于 2020-01-02 最后回复 2020-03-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除