|
|
SP Static PPMを用いた任意の部分列を復元できるデータ圧縮法です。
|
情報処理学会 自然言語処理研究会
(NL) 163回
|
BIP2004コンテストでの結果などについてです。
|
XML
and Type and TreeAutomata 学校の演習で、XMLと型とTree Automatonの関係をまとめました。
|
Compressed
Suffix Arrays Compressed Suffix Trees |
MoreGeometricDataStructure 学校の計算幾何ゼミで私の担当部分の資料です。
|
2004年度CPU実験まとめ (2004/04/02) 2004年度CPU実験まとめ(英語版)(2004/04/30) 情報科学科の情報科学実験2でのsoftware係でやったことをまとめました。せっかくやったので。
|
平成15年度未踏プロジェクト「汎用的データにおける確率的言語モデルの抽出及びその利用」 その内容について、最終成果報告ではないのですが、ほぼ今年の成果を網羅しています。 |
|
|
未踏プロジェクト中間報告用のパワーポイントです。 |
|
random復号についての簡単な説明、及びデモンストレーションプログラムを公開しています。
|
夏のプログラミングシンポジウム 公開論文 (2003 10/09) ・random復元できるデータ圧縮法 とかが載ってます。もし興味があれば見てください。 |
2002年度未踏Youth「単語抽出法による次世代データ圧縮法の開発」及び 注目すべきは、Static PPM法によるデータ圧縮のランダム復元の点でしょうか。このへんはここ最近開発している部分
|
|
現在注目を集めているSuffix Arrayについて、その構築を中心にまとめました。 述べているアルゴリズムは Larsson Sadakane法、Two Stage Sort(二段階sort法)、Copy Method 、Deep Shallow sort
|
2002年度未踏Youth、2003年度の未踏プロジェクトの進行状況などを発表しました。
|
|
2002年度未踏Youthプロジェクト「単語抽出法による次世代データ圧縮法の開発」の実績結果です。これで全てではないですが、とりあえず現時点で公開できるものを公開します。 ソースおよび、プログラム(Win32で実行可能)は、単語抽出を行うだけで、それ以降の特別な圧縮処理は一切していません。(それでも、ある程度の圧縮性能を持っています)これからの目標としては、このWXによって簡単になったデータの解析に基づいて、高度なデータの圧縮、及び解析というものを行っていこうと思っています。これだけで圧縮を行うと、静的LZ78法(という単語があるかはわからないが)みたいです。 復元速度は、今存在する圧縮プログラムの中でもかなりの上位に入るくらい速く、復元に用いるメモリも数十kBであり、このへんが他の圧縮法、圧縮プログラムには見られない特徴だと思います。使い方は 2003年度未踏プロジェクトで製作した「単語抽出法によるデータ圧縮プログラム」に関するpdfです。 |
|
圧縮アルゴリズムのうち、現在もっとも性能が良いものの一つと言われているアルゴリズム。 |
|
次の文字が何が来るかを予想するという、まるで人工知能みたいなことをして圧縮するアルゴリズム。
|