OpenAIとイーロン・マスク

メールのやり取りも公開していて、全面的に争う姿勢のようです。
「袂を分かつ」という感じです。

OpenAIの理想と葛藤がうかがえる気がします。
AGI の構築には膨大なリソースが必要で、それを賄える可能性があるのはGoogleだけのようです。
スケールでGoogleに対抗するのは絶望的なようです。

「実行とリソースに劇的な変化がなければ、OpenAI が DeepMind/Google に関連する可能性は 0% であると私は判断しています。・・・数億集めても足りない。これにはすぐに年間数十億ドルが必要です。」

「openAI のオープンとは、AI が構築された後は誰もが AI の成果から恩恵を受ける必要があることを意味しますが、科学を共有しなくてもまったく問題ありません…」と言うと、イーロンは「そうです」と答えました。」

「今日の OpenAI は現金を浪費しており、その資金調達モデルは Google (800 億企業) と真剣に競争できる規模に到達できないように思えます。真剣に競争できないのに公開で研究を続けている場合、実際には状況を悪化させて「無料」で彼らを支援している可能性があります。なぜなら、進歩したものはコピーしてすぐに大規模に組み込むのが非常に簡単だからです。」

「製品をゼロから構築することは AI 研究の焦点を奪い、長い時間がかかり、企業が Google の規模に「追いつく」ことができるかどうかは不透明であり、投資家は間違った方向に過度の圧力をかける可能性があります。私が思いつく最も有望な選択肢は、先ほども述べたように、OpenAI がドル箱として Tesla に所属することです。」

「私たちは、個人が OpenAI を完全に制御することは使命に反すると感じたため、Elon と営利契約の条件に同意することができませんでした。」

「Elon 氏は、Google/DeepMind に関連する競合他社が必要であり、自分でそれを行うつもりであると述べ、OpenAI を去りました。彼は、私たちが自分たちの道を見つけるのを応援すると言いました。」

AIが誰かのコントロール下にあることを拒むOpenAIの姿勢は素晴らしいと思います。
『誰もが AI の成果から恩恵を受ける』のも重要なことだと思います。
でも、ツールとしてのAIがブラックボックスになることはディストピアな気もします。

OpenAI and Elon Musk >>

上記の動画を生成したプロンプトだそうです。
A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

これまでAIで生成された動画に特有の「奇妙さ」「グロテスクさ」が少なくなってます。背景の群衆が個別に違和感なく歩いてるのがすごいです。

Soraのオフィシャルサイトには下記のように書かれています。詳しく解りませんが説得力があります。
「Soraは、複数のキャラクター、特定の種類の動き、被写体や背景の正確な詳細を持つ複雑なシーンを生成することができます。このモデルは、ユーザーがプロンプトで求めたものだけでなく、それらが物理的な世界にどのように存在するかも理解します。これまでのモデルには弱点があります。複雑なシーンの物理を正確にシミュレートすることに苦労し、原因と結果の具体的な例を理解できない可能性があります。例えば、人はクッキーを齧るかもしれないが、その後、クッキーには齧った跡がないかもしれない。」

Soraのオフィシャルサイトには「安全性」というセクションもあります。
「私たちは、世界中の政策立案者、教育者、アーティストを巻き込み、彼らの懸念を理解し、この新しいテクノロジーのポジティブな使用例を特定します。広範な調査とテストにもかかわらず、私たちは人々が私たちのテクノロジーをどのように使用するか、またどのように悪用されるかをすべて予測することはできません。だからこそ私たちは、実際の使用例から学ぶことが、時間をかけてより安全なAIシステムを作り、リリースしていく上で重要な要素であると考えています。」

新規性や自分たちの技術のアピールではなく、この段階で安全性を前面に出すことは企業の姿勢として公正さと信頼感があると思います。
こういった姿勢を取れないテクノロジーは淘汰されることになるかも。
日本の企業ではとても追いつけないくらい先を進んでいる気がします。

Soraのオフィシャルサイト >>

【関連記事】
AIで制作した短編映画『The Frost』と新しい映像制作

サービスとしてローンチされたのではなく、技術紹介として発表したものです。
テキストからAIで生成された動画はこれまでもありましたが、より一貫性のある動画を生成できるようです。

元動画を変換するのは楽しいツールになるかもしれませんが、テキストから生成される動画は著作権の問題もあって、仕事では使いどころがなさそうな気がします。
技術に詳しい人なら、また違う可能性を見つけるのかも。

「LUMIERE」ってネーミングは気に入りました。

Lumiere >>
https://lumiere-video.github.io/

「アートの未来はAIが握ってる」

興味深い記事です。
AIのアウトプットを人が作った作品として提示するのは、パロディだとしてもやめた方がよさそうです。

カリフォルニアで3人のアーティストがStable Diffusion、Midjourney に対して
「何百万人ものアーティストの権利を侵害する21世紀のコラージュツールであり、作品市場に実質的な悪影響を与えている。」
として訴訟を起こしているそうです。

裁判で著作権侵害を主張するには1対1で作品を比較して検証することが前提になっていて、現在の著作権法はAIによる著作権侵害に対処する能力を備えていないという意見があるようです。

現在のところ、AIを使って制作された作品には著作権は認められないとされています。
こういったAIプラットフォームを運用することの合法性についても疑問視されているそうです。

以下は記事からの抜粋です。

「現行の(米国の)著作権法は、誰が何を所有するかという概念を容易に決定できた時代に制定されました。
影響力とアウトプットがより曖昧なAIの時代に、創作と所有権の問題は複雑になっていて、この裁判を難しくしています。」

ある弁護士によると・・・
「1年前と比べると、巨大なテック企業が同意もクレジットも補償もなしに、人間が創作した作品にAIをトレーニングさせることには法的・倫理的問題があるという考えが、より広く受け入れられていると思います。・・・最終的には、生成AIは人間が作成したデータに依存するため、これらの企業はクリエイティブ産業と協力することを好むと思います。AI企業が人間のクリエイターを破産させれば、彼ら自身もすぐに破産するからです。」

また別の弁護士は・・・
「この集団訴訟の理論は、アーティストにとって非常に危険です。たとえ最終的な結果が実質的に類似していなくても、他人の芸術のいかなる側面でも自分の作品に取り入れ二次的著作物を創作したと裁判所を説得すれば、好きなアーティストの目の描き方をコピーするようなありふれたことでも、法的な危険にさらされる可能性がある。」

また、ゲッティイメージズも
「ゲッティイメージズの知的財産を驚異的な規模で堂々と侵害している 」
としてStability AI社を法廷に提訴しているそうです。

いつか、制作物はNFTになってることが必須になって、作者が実在の人間であることを証明することも必要になるのかも。

The future of art is in AI’s hands >>

Judge Appears Likely to Dismiss AI Class Action Lawsuit by Artists >>

スーパーインテリジェンスの規制について

これがいつかフランス革命の人権宣言のような歴史的なドキュメントになるのかも。

スーパーインテリジェンスは、これまでのどのテクノロジーも超える能力を持つと考えられています。
これには、原子力のIAEAのような規制や基準が必要になるとのことです。

ただし、スーパーインテリジェンスほどの重大な能力に至らないAIモデルの開発には、規制や基準を適用しないことも重要であるとも言っています。
これはスーパーインテリジェンスへの注目が薄れないようにするためだそうです。

「スーパーインテリジェンスの創造を止めることは危険であり、困難であると私たちは考えています。利点が非常に大きく、それを構築するコストは年々減少し、それを構築する主体の数は急速に増加しています。それは本質的に私たちが進んでいる技術的な道の一部であり、それを阻止するには世界的な監視体制のようなものが必要になるでしょう。それさえも動作する保証はありません。したがって、スーパーインテリジェンスを正しく理解する必要があります。」

ガバナンスの導入には公的機関が必要で、限界とデフォルトを民主的に決定すべきとしています。
その通りだと思います。

すごくSF的な話のようでもあるし、テクノロジーと人の関係のよくある話のようにも聞こえます。

Governance of superintelligence >>

デンマークのbe my eyes社は、GPT-4の画像認識能力を利用して「バーチャル・ボランティア」という、送られてきた画像に関する質問に答えるアプリだそうです。

これまでにも同様のアプリはあったようですが、
「ミスが多かったり、会話ができなかったりと、市販のツールでは、私たちのコミュニティが抱える多くのニーズを解決することはできませんでした。」とのことです。
新しい機能は人間のボランティアと同レベルの文脈と理解を提供できるそうで、視覚障害者のユーザーから好評のようです。

be my eyesではこれまで、人間のボランティアのみでユーザーをサポートしていました。
ユーザーが期待するような答えを得られなかったり、人間の対応の方が望ましい場合には、ボランティアに依頼することもできるそうです。

与えられた新しいオモチャで遊んでいるだけでなく、役に立てるニーズを見つけた方が良さそうです。

New GPT-4 app can be ‘life-changing’ for visually-impaired people, say users >>

YouTubeの新しいCEOニール・モーハンが書簡でYouTubeの今後の方針を発表しました。
その中でAIを活用した編集機能を準備中だと伝えています。
書簡全体としては、コミュニティを大切にしながら、クリエイターに利益とツールを提供して、YouTube市場を活性化させようというストーリーのようです。

以下は、リンク先からの抜粋です。

「YouTubeは、クリエイターが視聴者と深い関係を築き、好きなことで生計を立てるためのツールをより多く提供することを支援します。」

「クリエイターが求めているのは、単にアップロードできる場所だけではありません。Shorts、ライブ、ポッドキャストなど、さまざまな分野で意欲を高めていくための洗練されたツールが必要なのです。」

「動画を改革し、不可能と思われることを可能にするような方法で、AIの力が発揮され始めたところです。クリエイターは、AIのジェネレーティブな機能によって、仮想的に衣装を入れ替えたり、幻想的な映画の舞台を作ったりと、ストーリーテリングの幅を広げ、制作価値を高めることができるようになるのでしょう。」

新CEOのニール・モーハンさんは広告プロダクトのエキスパートだったようです。
これから広告収益が減りそうなGoolgeにとっては、なんとか死守したいところでしょう。

Letter from Neal: Our 2023 Priorities >>

OpenAIのCEOのサム・アルトマン

ChatGPTの生みの親のインタビュー記事。
煽っているようなタイトルですが、インタビューは真っ当で中道な印象です。
AIの未来は地獄でも天国でもなさそうです。

いくつか抜粋です。

「この分野は1つの企業にとっては大きすぎると思いますし、私はここに本当のエコシステムが生まれることを期待しています。」

「私がAIに期待しているのは「ウェブにアクセスして検索クエリを入力する体験をどう変えるか」ではなく「これまでとはまったく違う、もっとクールなやり方がないのか?」ということです。」

「AGI(Artificial General Intelligence:人の知能を完全に再現した機械)の誕生はそれほど明確な瞬間にはならないということです。いわゆるスローテイクオフという緩やかな移行になると思います。」

「もしAGIが本当に完全に実現したら、さまざまなかたちで資本主義を破壊すると思います。・・・もし本当にAGIが実現したなら、これまでとは異なる企業の仕組みが必要になるでしょう。私は、1つの会社が世の中のAIユニバースを所有するべきだとは思っていません。」

「私がOpenAIを誇りに思っていることの1つは、AGIの「オヴァートンの窓(多くの人に尊重すべきのものとして受け入れられる政治的な考え方の範囲)」を、健全だと思えるやり方で押し広げることができたということです。時に不快な印象を与えたとしても。」

「今後もオープンソースを続けていきます。」

サム・アルトマンは、メディア露出は控え目なようです。
最近はマイクロソフトとの仕事に多くの時間を使っていたみたいです。

ChatGPTの生みの親、サム・アルトマンが語る「AIと検索と資本主義の未来」 >>

Exclusive Interview: OpenAI’s Sam Altman Talks ChatGPT And How Artificial General Intelligence Can ‘Break Capitalism’ >>

CNET Your guide to a better future

2022年11月から数ヶ月間、金融関係の記事や説明文をAIで書いて掲載していたそうです。
単純にbotがどこからかテキストをコピペしてきたものではなく、ChatGPTのように語彙と構造を持って生成された文章です。

CNETはこれを認めるコメントを出したようです。ありふれたトピックについてのコンテンツを生成するためにAIを使っているのはニュースサイトの既成事実になってるようです。ただし、CNETの編集方針に沿って「徹底的に事実確認して編集された」記事であることを明言しています。
この記事について、Google検索でペナルティが課された様子もないそうです。

この既成事実によって読者からの信頼は失われるでしょうか?
編集者の役割が重要になって、ライターの仕事はなくなるでしょうか?
私たちはニュースサイトの記事がAIによって書かれたことを識別できるでしょうか?

CNETの「Your guide to a better future」というブランドスローガンが、ディストピアっぽく響いて、とてもいいです。

元記事はこちら
Popular Tech Site Has Been Publishing AI-Written Articles For Months >><

ツイートはこちら
https://twitter.com/GaelBreton/status/1613110191029121024

詳しくはこちら
[Investigation] Has AI Already Replaced Human Writers? >>

ChatGPTの台頭でGoogleの経営陣が「コードレッド」を発令

検索エンジンの広告収入にとって脅威になるようです。
CEOのピチャイはChatGPTが検索エンジン事業にもたらす脅威への対処に力を入れ直すよう社内の多数のグループに指示したそうです。

少しだけ使ってみた印象として、コーディングのアドバイスを得るにはChatGPTは素晴らしく速いと感じました。
コードが正しいかどうかは要検証なのですが、とりあえず「適当」な答えを得るまでが速いです。
さらに対話を進めると、やや「適切」な答えが得られました。
答え自体だけでなくこの質問と回答のプロセスも役に立つ感じでした。
すごい可能性がありそうだとすぐに感じられましたが、自然な対話のUIだからそう感じただけなのかもしれません。

情報に対しての認知プロセスが変わっていくような気がします。
もし「リンクをクリックする」というプロセスがなくなるとしたら、ネット広告だけでなくウェブ自体も変わって、いろいろなデザインが変わっていくのかも。

Google’s management has reportedly issued a ’code red’ amid the rising popularity of the ChatGPT AI >>

ChatGPTのリリースでGoogleは「コードレッド」を宣言、AIチャットボットが検索ビジネスにもたらす脅威に対応するためにチームを再割り当て >>

2022年12月24日 テクノロジー