Kafka 官方對 Job Queue 的實作進度:KIP-932: Queues for Kafka
在 Hacker News 上看到「Kafka at the low end: how bad can it get? (broot.ca)」這篇,原文「Kaf
Kafka 官方對 Job Queue 的實作進度:KIP-932: Queues for Kafka
在 Hacker News 上看到「Kafka at the low end: how bad can it get? (broot.ca)」這篇,原文「Kaf
哈佛法學院放出 data.gov 的備份資料
川普上台後大力打擊多元議題的題材,尤其是聯邦政府單位的文件中有提到多元議題的文件,都被行政命令要求下架,像是 CDC 就被下架大量的研究文件 (包括論文):「CDC webpages go dark as Trump targets publi
Knuth 去年年底 (2024) 在 Stanford 給的 Christmas Lecture
看到 Hacker News 上有人提到才想到 Knuth 每年年底都會給 Christmas Lecture,今年的也不例外:「Donald Knuth's 2024 Christmas Lecture: Strong and Weak
#Computer #Murmuring #Programming #2024 #christmas #component #components #graph #knuth #lecture #school #stanford #strong #theory #university #weak
Dating app 的數據
Dating app,直翻約會軟體,但應該蠻多人會翻約跑軟體...
Hacker News 上的「What really happens inside a dating app (luap.info)」這篇,文章在「What really happens inside a dating app」,內容很長,除非英文是你的母語,或是你閱讀英文的速度很快,不然我會建議你丟進 Google Translate 整頁翻譯,雖然有些詞翻的很好,看一下原文就知道是什麼了。
裡面有些數據上的結論很有趣,像是平台會特別照顧 iOS 用戶:
iOS users have more money and sp
https://blog.gslin.org/archives/2025/02/07/12255/dating-app-%e7%9a%84%e6%95%b8%e6%93%9a/
讓人痛苦的 UX:分開的 login code
在「The UX of login codes」這篇看到的,講的是 one-time password 的輸入設計問題:
這東西超多 designer 喜歡用,但對於 user experience (UX) 以及資安角度來說都很差。
先從 UX 的部分來
gitlab.freedesktop.org 的一些數據
在「Equinix Sunset, future of gitlab.fd.o」這邊看到因為贊助 gitlab.freedesktop.org (gitlab.fd.o) 的 Equinix 會停掉服務,所以接下來會需要搬家:
Equinix is shutting down its operations with us on April 30, 2025. They
BZip3
在 Hacker News 上看到 BZip3 的連結:「Bzip3: A spiritual successor to BZip2 (github.com/kspalaiologos)」。
雖然名字看起來與 bzip2 有關,但看起來是不同的人弄出來的東西,不過有些經典的演算法有留下來用,像是 Burrows-Wheeler transform。
另外值得一提的是,bzip2 是 1996 年出的 (不過 1.0 大約是 2000 年時出的),BZip3 的第一個 release 在 2022 年,這段時間也累積了不少有趣的演算法可以用。
無損壓縮中如果期望有比較的壓縮率,目前比較常用的應該是 LZMA 類的演算法 (差不多是 2001 年出現的),用的工具通常會是 X
PyPI 有 Archive 的狀態了
在 Lobsters 上看到 Python 的大本營 PyPI 要支援 archive 的狀態了:「PyPI Now Supports Project Archival」。
從 screenshot 可以看到也有 Unarchive 的按鈕,可以 undo 回來:
這樣看到 archived 的話,就不用再去 GitHub 上確認了... 之前 PyPI 上都是看 project 下載次數來抓感覺。
Google 家的 Swiss Table (高效率的 Hash 結構)
前幾天從 Lobsters 上看到「Maps are faster in Go 1.24」這篇,在講 Go 1.24 引入了 Swiss Table 取代本來的 hash algorithm,大福改善了 hash 操作的效能。
在 G
拿 gpt-4o-mini 讀最近很紅的檢察官起訴書
媒體資料版本是 PDF 版,自己 OCR 處理起來比較麻煩,這邊拿的是鏡週刊轉好成文字的版本:「【柯文哲起訴】柯文哲涉貪全紀錄 起訴書全文」。
我我用的是 open-webui,也就是「自己架 LLM fro
用 z-score 抓出異常的量
累積的有點久的一篇文章 (2020 年),本來以為寫過,結果沒找到...
裡面在講 Standard score (z-score) 這個很簡單的概念:「Simple Anomaly Detection Using Plain SQL」。這個方式不能抓到所有的異常,但夠大的異常基本上可以抓到,誤判率應該在可以接受的範圍。
給你一段 time series 資料,像是一分鐘一個 req/sec 的數字,一段時間後就會有很多筆,然後我們要判斷這些資料裡面是不是有
Google Chrome 的 Manifest V2 被關掉了
在「Tell HN: I just updated my wife's Chrome, and uBlock is no longer supported」這邊看到不再支援 uBlock 了 (這邊指的應該是 uBlock Origin)。
uBlock Origin 使用 Manif
Xerox 買 Lexmark
在 Hacker News 上看到「Xerox to acquire Lexmark (lexmark.com)」,Xerox 買 Lexmark 的公告:「Xerox to Acquire Lexmark」。
看到第一個想到的是「Xerox 居然還能買其他公司?」,第二個想到的是「居然看到 Lexmark 這個牌子!」,這則上到 HN #1 好像不算奇怪...
岔個題,話說印表機如果是自己用的話,還是買雷射碳粉的比較好用,久久印一次不會卡噴頭...
https://blog.gslin.org/archives/2024/12/23/12154/xerox-%e8%b2%b7-lexmark/
智障型電視 (Dumb TV) 的討論
在「Dumb TVs deserve a comeback (makeuseof.com)」這邊看到的討論,原文提到智障型電視應該要有他的市場:「Why Dumb TVs Deserve a Comeback」。
不過 Hacker News 討論上 id=42425593 提到很現實的問題:
Why dumb TV's won't make a comeback
改寫 feed2facebook
feed2social 專案是把 RSS feed 轉到其他的 social network 上 (我是拿 Mastodon 提供的 RSS feed),其中 Facebook 算是比較麻煩的,沒有 API 代表需要用比較複雜的方式解決...
先前 Facebook 有提供 mbasic.facebook.com,查資料可以得知一開始是提供給極低網路頻寬的地區使用的,所以頁面幾乎都是 html 加上很少的 javascript,剛好這樣的特性也很適合讓程式處理,算是當時比較方便的方式了。
https://blog.gslin.org/archives/2024/12/01/12105/%e6%94%b9%e5%af%ab-feed2facebook/
Git 的 hasconfig:remote.*.url:
在「How I configure my Git identities (benji.dog)」這邊看到的文章:「How I configure my Git identities」。
裡面在講 Git 的設定,以往我們習慣依據環境放到不同目錄裡 (像是公司的 repository 放到 work/),再加上 includeIf 去針對不同目錄給不同的值 (像是 email),這個功能是在 2017 年五月出的 Git 2.13 引入的,當初 GitHub 也有針對這個功能寫了一篇介紹:「Git 2
https://blog.gslin.org/archives/2024/11/25/12100/git-%e7%9a%84-hasconfigremote-url/
來試著用 mise
應該是前幾天在 Mastodon 上看到 (但找不到了) 有人提到 mise 這個套件,可以不用每個程式語言都裝各自的 version manager (以 Node.js 這邊的話就像是 nvm 或 fnm 的東西),剛剛先開個獨立的 user 丟進去測,測試的情況還可以接受,就換起來用看看...
官網提供的安裝方式有不少選項可以選,除了 ... | bash 的方法以外,還有自己抓 binary 下來,丟到任何可以跑的目錄下,或是透過 apt 安裝與更新。
有了 mise 後,接著把這段 code 放到每次 login 執行的地方:(P
https://blog.gslin.org/archives/2024/10/19/12040/%e4%be%86%e8%a9%a6%e8%91%97%e7%94%a8-mise/
Winamp 官方放出 Legacy 版本的程式碼
看到「Winamp Legacy player source code (github.com/winampdesktop)」這個,官方放出 Winamp 程式碼:「Winamp」,主要算是歷史的記錄,用電腦聽音樂如果是有設備的人應該會挑 foobar2000 之類的軟體,如果只是隨意聽的話應該就是開各家 streaming 的應用
Google 提出的 GoogleSQL (Pipe 版本的 SQL 改良)
看到「SQL Has Problems. We Can Fix Them: Pipe Syntax In SQL」這個研究投稿,PDF 檔案在 1004848.pdf 這邊。
Google 提出了 GoogleSQL 改善本來 SQL 的可讀性問題,另外也對 SQL optimizer 更有幫助。
直接拿 PDF 裡面的例子來說明,把本來是這樣的
Telegram 的 CEO Pavel Durov 在法國機場被收押
好幾個地方都有報導 Telegram 的 CEO Pavel Durov 在法國的機場被收押的事情,引 Reuters 的好了:「Telegram messaging app CEO Durov arrested in France」。
目前傳言的理由是缺乏管理,允許犯罪行為:
TF1 a