情報の可逆圧縮性を高めたい
前回も述べたのだが、自分の大事な情報は大事に将来に渡って
保持できるようにしてきたいはず。そのためにも容量を下げながら、
かつ劣化しないように保存していきたいものだと思う。是非この記事を
きっかけに一緒に考えていけると幸いである。では開幕。
結論
特に動画の可逆圧縮性を高めたよ!他も色々検討するよ。
なぜそう思ったのか
HDDを(通常使用から)駆逐したい。2~3年前からSSDを使い始め、
今ではデータストレージとして以外は完全にHDDを駆逐できないかな、と
思ってる。手元に残すデータも小さくできればその考えも現実に
できると思っている。なのでできるだけダウンサイジングすることは
正義であり、全人類が行うべき対応に違いないのだ(強弁)
やったこと
ということで私が行った可逆圧縮対応の色々を公開していく。
動画の可逆圧縮
私はYouTube動画をPowerPointから生成する形をとっているのだけど、
Powerpointが残っていればいつでも動画生成が可能になる。正確に言えば
可逆圧縮ではなくて、いつでも生成できるが正しいのだけど、動画を
残す必要性が無いので、生成後の動画は投稿後はサクッと毎回削除する
対応を行っている。普通に動画作成している場合はこうは行かない。
他のYouTuberの方々はどうしているのだろうか。YouTubeにあれば、
基本的にはローカルに残す必要はないのかもしれないけど、いずれ
他のプラットフォームに上げなおしたり、再アップする、あるいは
自分の動画であることを証明しなければならないような機会の際、
有効な証拠になる(ないことが一番なのだがあったときのお守りになる)
詳細
ベースと動画のサイズ差
これは色々語るよりも実際に見てもらった方が早い。見せる画面は
過去動画の出力前(Powerpointファイル)と出力後(動画ファイル)の
ファイルサイズの差である。極端なものになると、おおよそ24倍の差が
ある。ここまで圧縮できればかなりのものだと思う。他の要素では
さすがにここまでは行かないが、他の要素についても見てみこうと思う。
発展
動画はうまく出力前を準備できればかなり容量を抑えられる。他の要素は
正直そこまでは圧縮されない。というよりも動画の可逆圧縮が凄まじく、
あんまりよく見えないが、それでもそれなりに効果はあるので検討する
余地はあるのではないかと思う。
音声の可逆圧縮
まずは音声。音声の可逆圧縮方式にはflac/ape/tak/tteなどがあるけど、
いずれも
- 無圧縮に比べて可逆圧縮の圧縮率がそんなに良くないこと、
- 非可逆圧縮(例えばmp3ね)の音質で問題ないこと、
- そもそもストリーミング配信で問題ないこと、
で言うと、実は保存する必要性すらないのかも、と思ったりしている。
どうしても配信されていないもので残したい音声を残すときのみ
データ確保のためにflacの最大圧縮あたりで手を打てば解決です。
もっと言えば、CDとか持っているのであれば大事に持っていてください。
おそらくそのメディアは20年もしたらどれくらい有名なものでも、
非常に価値の高い(高く売れるとは言っていない)媒体になるはず。
しかし音声でもこの有様なので、本来の動画の可逆圧縮もあまり意味が
ない。前回の内容の通り、YouTubeに送ってしまえばデータ保存は
できるので圧縮する手間がもったいない。本当にYouTube様様である。
画像の可逆圧縮
次に画像なんだけど、大まかに分けると、
- JPEG画像はそのまま保存する(すでに非可逆圧縮)
- PNG画像はそのまま保存する(可逆圧縮形式)
- その他の形式(RAWとか)はサムネイルJPEG+ZIP圧縮で対応
で良いのではないかと思う。異論は認めるしむしろ教えてほしい。
正直ここも3.のパターンのみ対応する形で良い。
ちなみに、3.の画像はマイナーな音声ファイルと同じく、かなりレアな
ものに違いないのでできるだけしっかり残しておくことをお薦めする。
その他
まとめるとこんな感じになる。
動画の生成前データ以外は旨味が少ない
おさらいになるけど
- 動画:生成前データがあれば有効、動画はYouTubeに送る方が効率的
- 音声:マイナーなデータ以外は基本的にすでにネット上にある
- 画像:たいてい手元にあるものはなんらかの形で圧縮済み
という、正直保存するために圧縮する必要はないという結論になる。
ここまで来てなんだそれ、と思うかもしれないけど本当に残さないと
いけないデータは自分が生み出した元データで、動画以外はそこまでの
容量はないということが良くわかる。
なお、例えば動画/音楽/画像を自分で作る、いわゆるクリエイターの
データについては趣が異なる。できるだけ生成できる元データを
残しておいてほしい。おそらく時間が経ったときに価値のある
(高く売れるとは言っていない)データになると思う。
非可逆圧縮と可逆圧縮
そもそも、ここまで来て今更なんだけど、非可逆圧縮と可逆圧縮は、
- 非可逆圧縮:元に戻せない圧縮
- 可逆圧縮:元に戻せる圧縮
です。言葉の通りです。一番わかりやすい可逆圧縮はZIPファイルです。
非可逆(元に戻せない)だととっても困る、というか意味がない。
非可逆圧縮が最初に着目されたのが128kbpsで圧縮したmp3だと思う。
たしか1998年の出来事ですでに20年経過している。懐かしく昔話も
できるけど、インターネット老人会に突入してしまうので止めておく。
こぼれ話
とは言ってもYouTubeはサイズ無関係
しかし冷静に、何回考えてもYouTubeのサイズ無関係でアップロードが
できてしまうシステムには驚愕しかない。保管目的ではないので、
YouTubeのルールが変わったらどうしようもなくなってしまうけど、
とりあえず保存するってだけならこんなに緩くて良いのかな、と思える。
とにかく現時点で保管できる体制はかなり良い感じに整っているので
うっかり失う前に保存開始することをお薦めする。失ってからでは遅い。
なぜバックアップを取るのか
インターネット老人会のメインストリームを生きている私から見て、
もう既に生きていた記録の一部は、たとえ売っていたものでも自分で
保管しないと二度と手に入らないものになっている。
懐かしむことができるデータについては今からでも確保しておいて、
いつでも浸れる環境も、たまには良いよ、ということで、
このトピックを閉めたいと思う。
世の中にあるPCに身を任せる
今回のトピックでは保存するために色々画策しようとしたけど、
結果として世の中にある既存の手段でほとんどはカバーできる、という
結論に至った。では、その保存を行うためのデバイス、もっと端的に
言えばPCにこだわりが必要になるか、ということもついでに語れば、
この話にもっと深みが出るのではないかと思う。この問いに対する
私の答えはこだわる必要なし、である。世の中にあるPCで良い理由は
次回に持ち越したい。
コメント