marmooo's blog

2025年11月25日火曜日

GM2 MIDIミキサー Humidy を作った

MIDI Player/Synthesizer ライブラリ Midy の実装がだいぶ進んできて、 GM2 の再生も安定してできるようになってきました。まだ細かい実装不足やバグ、再生負荷の課題はあると思うのですが、そろそろ実用段階に入ってきています。そこでバグ潰しも兼ねて、GM2 の機能をすべて使える MIDI Mixer アプリ Humidy を作ってみました。

Humidy

GM2 は仕様がかなり大きいので、機能をすべて使ったアプリとか見たことないんですが、実際のところどうなんでしょう。ちなみにすべての機能を本気で使おうとすると UI が複雑になり過ぎるので省略している箇所はありますが、ライブラリからはもちろんすべて使えます。なるべくシンプルに作ったつもりですが、複雑な機能は簡単な UI にはしにくいので、普段は表示しないように押し込み、設定項目も無理やり減らしています。

名前は Timidity++ のもとになった英単語で timidity があって、同じように midi が出現するもう一つの英単語として humidity があるので、 humidity と Midy をもじって Humidy としました。

Midy は自分に合わせて作っているので作りやすいのは当たり前とはいえ、かなり短いコードで音楽ミキサーアプリを作ることができました。なかなかいい感じ。動的サウンドフォント、動的 fetch プログラムチェンジ、GM2 なども動くようになったので、いよいよライブラリとしても完成度が高まってきました。もう少し高速化したらすべての MIDI ライブラリは Midy に移行できそう。速度も激ヤバ MIDI 以外なら問題になることはないので、もう実用レベルと思います。激ヤバ MIDI は瞬間的なイベント数の負荷がブラウザの限界に達して死ぬので、イベント数を減らす処理をこれから入れていきます。

MIDI はサウンドフォント周りをもっと設定できたら面白そうなので、もう少し色々改良したいなと思っています。個人的に気になるのはリバーブです。 MIDI はサウンドフォントで Reverb Effects Send を決め打ちしますが、そこで決め打ちすると楽器によってはリバーブ効果がわからなくなります。現実のリバーブは Reverb Effects Send のように楽器によって効果が決まるのではなく、周波数に応じてリバーブの効果が変わる (低音ほど消える) はずなので、音響理論で考えると微妙な気もして、設定できたほうが嬉しい機会もあると思いました。開発者以外でこれに悩む人はいるのかという疑問はありますが、 MIDI プレイヤーをゼロから実装していると、こういう細かいところが気になってきます。

バグ潰しのために、さらに何種類かアプリを作ってみる予定です。

2025年10月2日木曜日

中学理科一問一答・中学社会一問一答を作った

中学理科一問一答と中学社会一問一答を作りました。きちんと教科書を使って作っているので、教科書準拠の重要語句を手軽にチェックできます。苦手分析もしっかりできるので、学校・塾・家庭でも使いやすいんじゃないかな。中学理科は計算問題を含めていないので語句・公式の確認に使えるくらいですが、それだけでも多くの人に使い道があると思います。四択問題で簡単なので、正答率は8割以上が目安なんじゃないかな。間違った問題は復習が必要です。

中学理科一問一答

中学社会一問一答

重要語句の意味や事実は静的なので、AI 生成することで作ってみました。穴埋め問題は AI が最も得意とする分野なので、精度も非常に高いことが期待できます。とはいえ融通が効かず 10分前に話した内容をすぐ忘れる AI さんに作ってもらうのは大変でした。それでも人間が作るより 100倍くらいはコストが低いと思いますし、 100倍楽なのだから頑張ろうと思って作りました。いかに安定して生成させるか、いかに質を安定させるか、いかに選択問題として使えるようにするか、いかにメンテできるようにするかが重要になります。 AI さんの知識量は凄いですが、行動は物忘れが激しいため細かい指定をしても守ってくれません。テストをきちんと書くことが大切だなと思いました。結構色々なチェックをしているので、問題がクソなケース以外はかなり除外できていると思います。問題がクソかどうかはたくさんプレイしてみてわかることなので完璧は難しいですが、ある程度は自分でもプレイしてみて確認はしています。このへんの開発の手間具合は、1年経ったらまた状況は違うんでしょうが、現状は AI があってもやはり大変です。

アプリとして公開できるようにするためには、かなりチェックが必要でしたが、それでも一度作ってしまえば、メンテコストは低いし、生成コストも、チェックのコストも低いのが良いところです。違う問題を作ってと言えば、他の問題も作れます。人間にこれをやらせると、個人開発では絶対無理だし、集団でもとんでもなく時間が掛かります。人間や過去問をベースとして作るよりAI で作ったほうが、一般性も網羅性も高くなる利点はあるので、結構良い AI の利用例かなと思います。ただ社会はかなり安定して問題を作れる一方で、理科は AI さんも知識不足な気がするので、問題はだいぶ自作しました。社会は割と安定して出力できるものの、やはり致命的なミスがたまにあったりするので、日頃の確認が必要です。

近年は高校受験や大学受験の問題を見ても、一問一答そのものが問題として出てくる機会はなくなっていますが、知識確認には依然として有用です。問題を解いた後に、どれくらい他のことを言えるか考えてみたり、使い道はたくさんあります。人気の問題集とかを見ても、結局は一問一答の延長線である問題のほうが多いので、実質的にはみんな今も使っている状態と思います。

そういえば AI で作れるよなー、くらいの気持ちで作ってみましたが、なかなか良いんじゃないかと思います。他のアプリもまったく確認せず作り始めたのですが、いくつかはあるみたいですね。まあ AI 生成ドリルとか、塾用のとか色々あるもんな。でもなんというかすぐに使えるものはなかなかないし、実際欲しいのはすぐ使えるものなので、まあ良いかなという気持ちです。今のところ中学社会一問一答・中学理科一問一答という名前にしていますが、今後の実装レベルによっては名前を変えるかも知れません。

2025年9月7日日曜日

謎のエフェクトライブラリ emoji-particle を作った

謎のエフェクトライブラリ emoji-particle を作りました。イメージ図のように、絵文字で花火を打ち上げたり、ポップコーンっぽいエフェクトを表示できるライブラリです。柔軟なエフェクト設定ができるため様々な用途に応用できます。

Demo でおおまかな動作を確認できますし、 marmooo/emoji-particle から MIT ライセンスでコードを利用できます。

前からずっと似たようなものは欲しかったのですが、真面目に実装すると大変で放置していたのですが、既存アプリが増えてきていよいよ欲しくなってきたので作りました。 Web Worker + OffscreenCanvas + 効率的な更新処理で実装しているので、無駄に高速・高機能なライブラリとなっています。内部の実装もかなり色々な最適化をしているので、大量に絵文字を飛ばしても重いと感じることはほぼないでしょう。

Worker を使ったライブラリを何も考えずに公開すると同一ドメインの制約があって使いにくいので、インライン化することで簡単に使えるようにしています。 import { createWorker } from "emoji-particle"; するだけで使えるようになっています。 Worker 系のライブラリだとあるあるなんでしょうが、ビルドはみんなどうしてるんでしょう。私はもちろん esbuild でオレオレビルドです。

こういったエフェクトは、良いものを作ろうとすると画像が必要ですが、たくさん画像を使い始めると取り扱いが急に面倒になります。 RPG ツクールのホコグラっぽく管理すれば多少は…とは思うのですが、そういうことを考えるのも嫌です。画像を扱い出すとと、ファイルサイズも大きくなるし、画像ファイルの管理も面倒だし、ライブラリのロードも面倒になります。絵文字はどんな環境でも使えるカラフルな画像集なので、このようなときに最も扱いやすいです。

シンプルな割にはあらゆる場面で使えて便利なライブラリだと思っています。これまで作ったアプリたちにもこれから組み込んでいきます。それっぽいエフェクトを付けたい時には最も重宝するライブラリになりそう。

2025年8月26日火曜日

頻出順の英和辞書 mGSL を更新した

頻出順の英和辞書 mGSL を更新しました。以前開発した mGSL は頻出順データ自体は最強でしたが、既存の辞書を利用しているため和訳の粒度にバラツキがあり、英和辞書としては不安定でした。

そこで生成 AI を活用して簡易的な和訳を作り、最強の和英辞書に作り変えました。生成 AI を使って詳細な辞書を作るのはかなり苦しいと思いますが、英単語学習では典型的な意味表現のみを知っていれば十分です。なるべく覚える言葉自体が少なくなるように和訳の粒度を調整した辞書として mGSL を更新しました。このような用途では生成 AI による文章生成が極めて有効です。とはいえ既存の辞書データでさえ 3万語あったので、すぐにはできません。 AI の生成は頻繁に壊れるので完全には自動化できないため、サボれる時間を見つけてちまちまと文章生成を繰り返すことで構築しました。

まずは既存の辞書に登録されていた 3万語まで和訳を付けました。しかし既存の辞書のデータは頻度データをきちんと考慮していないので、実際には頻度7000語くらいまでしか安定して登録されていません。それ以降は歯抜けが多いので、ちまちまと翻訳を作っていく必要があります。 lemmatization されたデータは 6万件あります。厳密な頻度で 3万語に到達する頃には、3万5000語くらいになってそうです。これはさすがに果てしない…ということで、頻度 1万語までは完璧なものにしてこの記事を書きました。それ以上はニーズの低さからやる気があまり出ないですが、ぼちぼちやりたいところ。 1万語あれば海外の大学生くらいの語彙数になるので、たいていのニーズは満たせるでしょう…。

生成された訳は目視で気になる点はチェックしており、機械的に処理できるようにフォーマットを整えたりしています。訳が不安定なところも微修正しています。ドイツ語やイタリア語など、英語以外の語彙も含まれているので、英語学習には不向きなものも多々あります。これらは機械的に除外できるようにしました。 AI さんに頼んでもすぐ崩壊するのでこのへんは手動で直すしかありません。手動は手間ですが、和訳を作る部分が一番時間が掛かるので、90% は時間を削減できているでしょう。それでも結構な時間は掛かりました。単調すぎて眠いのが地味に厳しかった。ただその甲斐もあってか、以前は見つからなかったアラも多少修正できました。依存ライブラリをがっつり減らすことができて、だいぶ気楽になりました。

英単語学習の辞書データとしては、より詳細なものを作る以外だと、これ以上のものを作るのは難しいんじゃないかな。あるとしたら lemmatization をちょっと改良できるくらい。これはいずれ検証したい。あとはいよいよ接尾辞や現在分詞、過去分詞をもっと考慮して語彙数を減らしていくほうが、辞書としては質が高くなるのかもなあ。

Vocabee など既存の英単語アプリ、 graded-enja-corpus などの派生ライブラリには反映済みですが、新規アプリも今後作っていきます。やはり和訳の粒度を調整できているのはあまりにも大きい。以前と変わらず CC-BY-SA で使えるので、使いたい人はどうぞ。

2025年7月6日日曜日

圧倒的インフレゲームの億千万タイピングを作った

圧倒的インフレゲームの億千万タイピングを作りました。タイピングは色々なものを作っていますが、タイピングを最も学ぶのは小3〜小4なので、その年代でより面白いものが作れればと前々から思っていました。という訳で作ったのがこれで、学習指導要領に合わせて万・億・兆などの桁を学びながらタイピングができます。さらに京・垓・秭・穣・・・無量大数まで対応しているので、圧倒的インフレのタイピングを楽しめます。

億千万タイピング

タイピングとしてはすこし難しいけど、面白いかもなという感じです。私は小さな頃、家に転がっていた参考書を読んでいたら無量大数まで桁があることを知ったのですが、今の子はどうやって覚えるんでしょう。兆の先を知る機会ってあんまりないんじゃないかな。こんな感じの神ゲー(笑) で遊んでみるとすぐに覚えられます。

いわゆるインフレゲーはたくさんありますが、無量大数がすぐに出てくるゲームはなかったと思う。ゲームの終盤になってやっと出てくるのが限度でしょう。学習用途で使うのはなかなか難しい。その点、億千万タイピングはスタート時点から無量大数に親しめるので、効率的に勉強できます。

億の桁を超えると、ローマ字を表示しきれなくなるのでどうするかで悩みましたが、表示しきれないものは見えないようにしてしまって、桁が変わるごとにテキストを削減することで対応しました。何回か遊べば、その後は違和感なくプレイできると思います。

神ゲーというかネタゲーですが、たまにはこういうのも良いと思う。無量大数の得点をゲットできるので、友達と争うのにいいかも。打鍵速度が十分に早くなってくると引き運ゲー感があるけど、そこはまあ仕方ない。

2025年6月15日日曜日

シームレスなエフェクトを適用するアプリ CV-Masker を作った

シームレスなエフェクトを適用するアプリ CV-Masker を作りました。マスクを手書きで設定して、そのマスクに対してグラデーションをかけつつシームレスなエフェクトを適用できます。

CV-Masker

色々なエフェクトを用意しているので画像はあくまでイメージですが、こんな感じの画像をサクッと作れます。

最初は cv.colorChange, cv.illuminationChange, textureFlattening などのシームレスなエフェクトを与える関数の確認のために作っていたのですが、いくつかボツ案があったので、マスクにエフェクトを掛けて遊ぶアプリに変えました。

当初の目的のシームレスなエフェクトの関数は、良い感じの画像を作れるのですが、へぼい CPU だと処理速度がちょっと遅かったです。コードを見ると SIMD + Threads の最適化は甘そうなので、将来の改善に期待です。やはり OpenCV と言えども、コア部分以外は遅い時もあるとわかりました。あと textureFlattening は実行するたびに結果が異なるので元の実装がバグってると思う。

OpenCV の cv.colorChange などの関数は高度なシームレス処理を行っていますが、たいていそこまで精度は必要ありません。そこで自作の軽量な汎用局所シームレス関数を作って遊べるアプリにしました。 0/255 で書いたマスクを boxFilter でグラデーション化して、グラデーション化したマスクに任意のエフェクトを掛け合わせます。処理は非常に軽いですが、十分なシームレス感があります。どんなエフェクトでもシームレスに適用できますが、一般的かつシンプルなエフェクトをいくつか利用できるようにしておきました。局所モザイク、局所シャープ化、局所色調補正などが利用できます。いざ作り始めたら追加したいエフェクトが多すぎて困ってきましたが、応用的なエフェクトは別のアプリで作ります。アルゴリズム多すぎのものはすぐに組み込むのが難しいです。

シームレスなエフェクトを加える関数は、メモリリークが直らず苦労しました。やはり C++ は行数が増えてくると、ハマったときになかなか厳しい。結局少し前のバージョンでは直らず、すべて書き直したら直りました。メモリリークそのものは input event で大量に処理させるとすぐに見つかります。たぶん MatVector の扱いが一番難しいのですが、 push_back() はコピーらしいので、すぐに delete() するのが綺麗だと思う。参照がどうなってるか熟知してないとできないのが厳しい。

const resultVec = new cv.MatVector();
for (let i = 0; i < 4; i++) {
  const ch = srcChannels.get(i);
  resultVec.push_back(ch);
  ch.delete();
}

手軽にいい感じのエフェクトが作れるので、結構使いやすい気がします。

2025年5月12日月曜日

様々な非写実的レンダリングを適用するアプリ CV-NPR を作った

様々な非写実的レンダリング (Non-Photorealistic Rendering) を実現するアプリ CV-NPR を作りました。最近は生成 AI で画像がすごく簡単に作れるようになっているので、そちらとは技術がズレている感はありますが、最近 Web 上で手軽に使えるようになった技術を地道にアプリ化しています。

CV-NPR

色々なエフェクトを用意しているので画像はあくまでイメージですが、こんな感じの画像をサクッと作れます。

このアプリでは OpenCV の cv.detailEnhance, cv.edgePreservingFilter, cv.pencilSketch, cv.stylization、cv.oilPainting などの面白エフェクトが利用できます。上記はそれなりに有名でいろいろな記事がネットでも見つかりますが、もっと色々なエフェクトが欲しかったので、モザイク、色鉛筆化、cv.applyColorMap, cv.anisotropicDiffusion などをさらにサポートしました。色鉛筆化は Lineart Converter を作ったときにできた副産物です。 cv::anisotropicDiffusion はうまく使うと迷路画像や、味のあるスムージングができます。たいして設定項目がなく使えるエフェクトはこれくらいでした。他に何かあるかな？

GIMP や Photoshop で使うようなエフェクトが Web 上で実現できれば、割と便利かもなと個人的には思っています。とはいえまだまだエフェクトが足りないのが現状です。ただあまり時間は掛けたくないし、今回は OpenCV だけを使って実現できることを実装しています。 OpenCV を使えば 1日で根幹部分は作れるので…。なんらか実装が必要なものは、他のアプリで作る予定です。

実装はしないように心掛けたアプリなので、正直このアプリでは開発期間の大半はビルド時間だったりします。公式にはまだサポートされていないように見える機能を色々使っているので、チェックするたびにビルド時間が掛かりました。色々なモジュールを触り始めたことによってビルドが苦痛でした。 wasm を作るだけで 1時間近く掛かります。またアプリごと・ビルド種類にビルド用のディレクトリを持ってキャッシュすると 1GB 以上容量がいるし、キャッシュしてもオプションを少し変えただけで無意味化する問題などがあります。 ESM 並の tree shaking ができるなら依存関係をモリモリにしてビルドできるのですが、依存関係をモリモリにすると不要な定数を大量に登録される問題もあります。このままアプリを増やしていくとビルドだけで 1日掛かりそうな気がしたので、依存関係を真面目に処理して簡単にビルドできるスクリプトを作りました。ビルド時間が 1/100 になるので本家にも反映してほしい機能ですが、デフォルトの Python 設定ファイルだとモジュールの情報がなくてできません。 OpenCV には裏コマンドとして JSON 形式の設定ファイルがあるのですが、そちらならできます。というか Python 設定ファイル、JavaScript で言うところの eval 使っていて、危ないしやめたほうが良い気がするけどなあ。本体の改良もできるようになってきて、OpenCV のこともちょっとわかってきた気がします。