Thinking Realm

  • 首页

  • 标签311

  • 分类19

  • 归档154

  • 关于

  • 搜索

字符串字符统计

发表于 2018-11-22 | 更新于 2021-03-23 | 分类于 Python
给定一个字符串,需要统计字符串中每个字符出现的次数,并按照出现频次从高到低排列。 方法一: 123456>>> s = 'hello, world'>>> a = {k:s.count(k) for k in set(s.replace(' ','')) ...
阅读全文 »

Top K 问题

发表于 2018-11-22 | 更新于 2021-03-23 | 分类于 algorithm
一步解决数组的Top K有点困难,不妨逐步解决,先从简单的开始,比如只要找到数组中的最大的一个数可以这样实现: 方法一: 12345678910def findLargest(arr, arr_size): if not arr: return -1 largest ...
阅读全文 »

Python网络编程之实现FTP服务器

发表于 2018-11-21 | 更新于 2021-03-23 | 分类于 Python
复习《Python核心编程》第三章:因特网客户端编程,本章介绍了文件传输、网络新闻和电子邮件三种客户端的编写方法,基本流程都一样: 连接到服务器 登录 发出服务请求 退出 下面以FTP为例,实现一个简单的服务器、客户端交互,客户端能实现下载、上传等功能。 服务器Python下实现FTP服务器很简 ...
阅读全文 »

数据结构之线性表(二)

发表于 2018-11-21 | 更新于 2021-03-23 | 分类于 data-structure
静态链表用数组描述的链表叫做静态链表,它是为高级语言实现单链表而设计的一种方法。数组的每一个元素由data和cur组成,数据域data存放数据元素,cur相当于指针,存放后继元素的下标,又叫做游标。 优点:进行插入和删除时,只需要修改游标,不需要移动元素 缺点:无法随机存储;没有解决连续存储带来难以 ...
阅读全文 »

排序算法(四)排序算法时间复杂度统计

发表于 2018-11-21 | 更新于 2021-03-23 | 分类于 algorithm

汇总8个排序算法的时间复杂度统计与比较

阅读全文 »

数据结构之线性表(一)

发表于 2018-11-20 | 更新于 2021-03-23 | 分类于 data-structure
定义线性表:零个或者多个数据元素的有限序列,注意线性表的第一个元素没有前驱,最后一个元素没有后继,指向为空,并且任意一个元素仅仅对应一个或零个元素。 存储结构 顺序存储结构 顺序存储结构指的是用一段地址连续的存储单元依次存储线性表的元素,顺序存储结构具有三个特性: 存储空间的起始位置 线性表的最 ...
阅读全文 »

用Python为你念一句诗

发表于 2018-11-19 | 更新于 2021-03-23 | 分类于 Python

看完网络编程的知识,觉得客户端和服务器之间消息传递太无聊了,于是调用了一个外部API和语音合成服务,只要在客户端输入任意内容,服务器返回一句诗并读给你听。

阅读全文 »

排序算法(三):希尔排序

发表于 2018-11-19 | 更新于 2021-03-23 | 分类于 coding , algorithm
希尔排序是插入排序的升级版,回忆插入排序,当拿到一张新的扑克牌,我们需要拿着它逐一与手中的牌比较。当这张新的扑克牌恰好是最小的,那意味着手里有多少张牌就要移动多少次,所以插入排序的时间复杂度跟原数组的有序程度紧密相连。 为了提高插入排序的效率,算法专家考虑是否能先把数组变得相对有序一些,尽量先把数组 ...
阅读全文 »

排序算法(二):堆排序

发表于 2018-11-18 | 更新于 2021-03-23 | 分类于 coding , algorithm
完全二叉树的特点(百度百科): 一棵二叉树至多只有最下面的两层上的结点的度数可以小于2,并且最下层上的结点都集中在该层最左边的若干位置上,则此二叉树成为完全二叉树,并且最下层上的结点都集中在该层最左边的若干位置上,而在最后一层上,右边的若干结点缺失的二叉树,则此二叉树成为完全二叉树。 完全二叉树具备 ...
阅读全文 »

Python 工具箱系列 (6):为jupyter notebook中添加虚拟环境

发表于 2018-11-01 | 更新于 2021-03-23 | 分类于 Python

image

阅读全文 »

详解RNN文本分类模型的架构

发表于 2018-11-01 | 更新于 2021-03-23 | 分类于 Machine-Learning
典型RNN模型下图是典型的RNN模型,$X$是输入,对文本经过嵌入层嵌入处理,再进入RNN,RNN的后面是全连接层,输出各个类别的概率。 下面来描述一次数据从输入到输出的完整过程: 在自然语言处理中,不管是中文还是英文,首先第一步的任务是如何将文本数据数值化。对于中文,可以先建立词汇表,给词汇表中 ...
阅读全文 »

基于 sklearn 的传统机器学习在搜狗新闻数据的文本分类实践

发表于 2018-10-31 | 更新于 2021-03-23 | 分类于 Machine-Learning

sklearn is good tool.

阅读全文 »

读懂sklearn的classification_report

发表于 2018-10-31 | 更新于 2021-03-23 | 分类于 Python

本文介绍如何读懂classification_report的各个指标。

阅读全文 »

基于 Tensorflow 的 TextRNN 在搜狗新闻数据的文本分类实践

发表于 2018-10-30 | 更新于 2021-03-23 | 分类于 Machine-Learning

先前一篇文章基于 Tensorflow 的 TextCNN 在搜狗新闻数据的文本分类实践是CNN在文本分类中的一次尝试,在接触了LSTM之后了解到它自然语言处理中有非常广泛的应用,比如情感分析、信息提取(命名体识别)、机器翻译等领域大放异彩,本文就来看看它在文本分类上究竟会有什么样的表现。

阅读全文 »

机器学习算法系列(18)理解 LSTM 网络

发表于 2018-10-29 | 更新于 2021-03-23 | 分类于 Machine-Learning

先前仅仅是听RNN这个名词比较多一点,但没有深入去了解,在前一篇文章中我用CNN做了一次文本分类的实践,然后发现RNN也可以完成该任务,所以便开始寻找相关资料学习RNN。我比较推荐台大李宏毅老师的机器学习课程,算是比较清晰易懂的了,没有公式堆砌,完全“人肉手撕”。课程里面有两节专门讲解RNN,第一节讲原理(认真看),第二节讲应用的场景(快速过)。

学完课程,对照PDF课件差不多知道了RNN相比传统的神经网络具有“记忆”的特性,更加注重数据的上下文关系,就不难理解现有语音识别、机器翻译、自动生成等等技术背后的知识,以及RNN最成功的扩展长短时记忆网络(简称LSTM,Long Short-term Memory)。现在,我基本理解了RNN的一些知识,以笔记的形式记录下来。

阅读全文 »

Linux 工具箱系列(2):创建交换空间

发表于 2018-10-26 | 更新于 2021-03-23 | 分类于 Linux

安装Ubuntu的时候没有创建交换空间,最近跑代码的时候提示内存不足,有必要创建交换空间了,下面记录如何为Linux创建交换空间。

阅读全文 »

基于 Tensorflow 的 TextCNN 在搜狗新闻数据的文本分类实践

发表于 2018-10-26 | 更新于 2021-03-23 | 分类于 Python

这篇文章记录了从零开始用 tensorflow 构建卷积神经网络模型,并对搜狗的新闻数据做的文本分类实践。众所周知,tensorflow 是一个开源的机器学习框架,它的出现大大降低了机器学习的门槛,即使你没有太多的数学知识,它也可以允许你用“搭积木”的方式快速实现一个神经网络,即使没有调节太多的参数,模型的表现一般还不错。目前,tensorflow 的安装已经变得非常简单,一个简单的pip install tensorflow即可,然后import tensorflow as tf就能愉快玩耍了。

阅读全文 »

Flask 入门(7):添加文章编辑器

发表于 2018-10-20 | 更新于 2021-03-23 | 分类于 Python

阅读全文 »

Flask 入门(6):登陆注销机制

发表于 2018-10-20 | 更新于 2021-03-23 | 分类于 Python

阅读全文 »

Flask 入门(5):添加登陆页面

发表于 2018-10-19 | 更新于 2021-03-23 | 分类于 Python

阅读全文 »
123…8

H4ck3r L1

专注机器学习、大数据

154 日志
19 分类
311 标签
RSS
GitHub douban
Creative Commons
友链
  • Free will
  • 徐阿衡
  • 十一城
  • yao zhen
  • kba977
  • Babyzpj
  • w0x7ce
全站共210.8k字
欢迎关注我的公众号
© 2016 — 2021 All Rights Reserved.
0%