用 Hadoop 统计词频并存入 HBase 中

发表于 2016-11-09 更新于 2016-11-12 Disqus：

统计一个 TXT 中的所有词语出现的平均频率（总出现次数／总共出现过的TXT文档数量），并写入 Hbase

一共用到 MapRecuce 的四个步骤：

Mapper 负责把把原来的任务分成很多Key-Value块。本题中，我们把任务分成这样的键值对：<Term#Doc, 1>

阅读全文 »

32位程序的ROP攻击示例

发表于 2016-10-29 更新于 2016-10-30 Disqus：

给定的程序 readelf32 存在一个漏洞（想多了，这当然不是Linux里的readelf），它读取文件内容写入到一个局部变量，但没有正确地检查文件大小。

实验中假设 ASLR 已经关闭：

1	echo 0 >/proc/sys/kernel/randomize_va_space

阅读全文 »

Go 学习笔记

发表于 2016-10-27 更新于 2016-10-31 Disqus：

因为工作项目原因，跟着 tour 学习了一下 Golang。语法比较奇怪，记下备忘。

Gist link

阅读全文 »

在IntelliJ IDEA中使用Gradle的最佳实践

发表于 2016-08-16 更新于 2017-05-12 Disqus：

目标

在IDEA中建立一个带有Spring框架等依赖的Java工程，并用Gradle作为包管理器，该项目在Tomcat中运行

How

Step 1: 使用 Gradle 或者 IDEA 自带的向导，建立 Gradle 工程

Step 2: 向 build.gradle 中添加插件、依赖等等，例如：

阅读全文 »

天翼校园客户端逆向工程

发表于 2016-08-09 更新于 2017-08-31 Disqus：

本文转载自好友ZLM大神的博客。反正几个月前离开学校的时候还能用。备个份，也许能造福后人。如果感到正文不明觉厉请直接跳到最后的patch

阅读全文 »

九连环的解法和代码

发表于 2016-07-23 更新于 2016-07-24 Disqus：

今天第一次解九连环，觉得这个小玩具还是很有思想的，特把解法整理如下。

阅读全文 »

OpenCV 矩阵运算小结

发表于 2016-04-09 更新于 2017-08-19 Disqus：

这份总结适用于OpenCV 2 以上版本，官方详尽的文档在这里。

概述

OpenCV 里的矩阵分静态和动态两种：

动态就是 Mat 类，已经实现了引用计数，编程时几乎不用考虑内存问题；你可以将Mat看作一个头——包含矩阵内存区域的指针和矩阵的大小、类型等信息。
静态以 Matx 类为代表，需要程序员自己开辟内存区域，其存储方式和数组完全一样，没有额外的存储空间，矩阵自身的信息都以模板的方式静态编译了。

阅读全文 »

MATLAB 面向对象编程 Cheatsheet

发表于 2016-03-03 Disqus：

A Simple Class

Doc Link

阅读全文 »

黑板客爬虫闯关解答（更新到第五关）

发表于 2016-02-21 更新于 2017-08-19 Disqus：

初学爬虫，又没什么想爬的东西，正好看到这个闯关就做了一下。截至今天，游戏作者更新到第五关。

前面4关都比较简单，具体请搜索网上的教程。比如这里有个详细的。

我的代码放在 GitHub：fuyufjh/crawler_ex_answer

阅读全文 »

十分钟的 pandas 入门教程（中文翻译）

发表于 2016-02-05 更新于 2017-08-22 Disqus：

原文是 pandas documentation 中的 10 Minutes to pandas

十分钟你妹啊！！

导入 pandas、numpy、matplotlib

In [1]: import pandas as pd

In [2]: import numpy as np

In [3]: import matplotlib.pyplot as plt

阅读全文 »