Strike Freedom

Live fast. Die young. Be wild. Have fun.

温馨提示:请科学上网以确保流畅访问本站点。

Discovery

后会有期

这是我在 2018 年 10 月份从腾讯离职时所写的一篇感悟文章,最早发表在个人公众号里,重新整理了一下发表在我的个人博客这里。

Java 全文检索引擎工具包 Lucene 原理解析

Lucene 是什么? Lucene 是 apache 软件基金会 4 jakarta 项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene 的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。Lucene是一套用于全文检索和搜寻的开源程式库,由[Apache](https://ba

【译】Spark 分区机制的应用及 PageRank 算法的实现

本文翻译自 https://www.safaribooksonline.com/library/view/learning-spark/9781449359034/ch04.html 佩奇排名(PageRank),又称网页排名、谷歌左侧排名,是一种由搜索引擎根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一,以Google公司创办人拉里·佩奇(Larry Page)之姓来命名。Google用它来体现网页的相关性和重要性,在[搜索

MQ 对比之 RabbitMQ vs Redis

消息队列选择:RabbitMQ & Redis RabbitMQ RabbitMQ是一个由erlang开发的AMQP(Advanced Message Queue )的开源实现的产品,RabbitMQ是一个消息代理,从“生产者”接收消息并传递消息至“消费者”,期间可根据规则路由、缓存、持久化消息。“生产者”也即message发送者以下简称P,相对应的“消费者”乃message接收者以下简称C,message通过queue由P到C,queue存在于RabbitMQ,可存储尽可能多的message,多个P可向同一queue发送message,多个C可从同一个queue接收message RabbitMQ架构:

周杰伦的《烟花易冷》和《洛阳伽蓝记》的前世今生

《烟花易冷》的前世今生 《烟花易冷》这首歌发行之时我便已听过了,按照周董『一张专辑一首中国风』的传统,《烟花易冷》便作为专辑《跨时代》的中国风歌曲面世,一曲终了,并没有初听《东风破》、《青花瓷》和《菊花台》这些前作般的惊艳之感,不仅如此,因为周杰伦在演绎这首歌时的不同于以往的唱腔 — 低沉阴冷,可能许多不常听周杰伦的人都会问:这是周杰伦唱的吗?甚至我这个老歌迷也觉得这的确是他刻意做的改变,所以当时并没有对这首歌有太多的青睐,就觉着是周杰伦的一首风格『奇怪』的中国风,也便止于此了。 前阵子,网易云『每日推荐』里给我推了这一首《烟花易冷》,重听之后,与几年前的感受很不一样,似乎听出了《东风破》的哀愁、《发如雪》的凄美、《青花瓷》的婉转,歌词也写出了一种败落、苍凉的感觉,而且歌词的故事性居然还比较完整,要知道方文山的中国风歌词那都是走的是印象画派、意识流小说这种风格 — 意象丰富、故事零碎。这倒是激起了我的兴趣,我上网搜了一下

GMP 并发调度器深度解析之手撸一个高性能 goroutine pool

并发(并行),一直以来都是一个编程语言里的核心主题之一,也是被开发者关注最多的话题;Go 语言作为一个出道以来就自带 『高并发』光环的富二代编程语言,它的并发(并行)编程肯定是值得开发者去探究的,而 Go 语言中的并发(并行)编程是经由 goroutine 实现的,goroutine 是 golang 最重要的特性之一,具有使用成本低、消耗资源低、能效高等特点,官方宣称原生 goroutine 并发成千上万不成问题,于是它也成为 Gopher 们经常使用的特性。 Goroutine 是优秀的,但不是完美的,在极大规模的高并发场景下,也可能会暴露出问题,什么问题呢?又有什么可选的解决方案?本文将通过 runtime 对 goroutine 的调度分析,帮助大家理解它的机理和发现一些内存和调度的原理和问题,并且基于此提出一种个人的解决方案 — 一个高性能的 Goroutine Pool。

Tornado 配合 Celery 及 Rabbitmq 实现 web requests 异步非阻塞

Tornado和Celery介绍 1.Tornado Tornado是一个用python编写的一个强大的、可扩展的异步HTTP服务器,同时也是一个web开发框架。tornado是一个非阻塞式web服务器,其速度相当快。得利于其非阻塞的方式和对 epoll的运用,tornado每秒可以处理数以千计的连接,这意味着对于实时web服务来说,tornado是一个理想的web框架。它在处理严峻的网络流量时表现得足够强健,但却在创建和编写时有着足够的轻量级,并能够被用在大量的应用和工具中。 进一步了解和学习tornado可移步:tornado官方文档 2.Celery Celery 是一个简单、灵活且可靠的,处理大量消息的分布式系统,它是一个专注于实时处理的任务队列, 同时也支持任务调度。Celery 中有两个比较关键的概念: Worker: worker 是一个独立的进程,它持续监视队列中是否有需要处理的任务; Broker: broker 也被称为中间人或者协调者,br

深入 Go 语言之 goroutine 并发控制与通信

开发go程序的时候,时常需要使用goroutine并发处理任务,有时候这些goroutine是相互独立的,而有的时候,多个goroutine之间常常是需要同步与通信的。另一种情况,主goroutine需要控制它所属的子goroutine,总结起来,实现多个goroutine间的同步与通信大致有: 全局共享变量 channel通信(CSP模型) Context包 本文章通过goroutine同步与通信的一个典型场景-通知子goroutine退出运行,来深入讲解下golang的控制并发。 通知多个子goroutine退出运行 goroutine作为go语言的并发利器,不仅性能强劲而且使用方便:只需要一个关键字go即可将普通函数并发执行,且goroutine占用内存极小(一个goroutine只占2KB的内存),所以开发go程序的时候很多开发者常常会使用这个并发工具,独立的并发任务比较简单,只需要用go关键字修饰函数就可以启用一个goroutine直接运行;但是,实际的并发场景常常是需要进行协程间的同步与通信,以及精确控制子goroutine开始和

Strike Freedom