MAYAWEB.JP
土曜日, 3月 25, 2023
  • ITニュース
  • 地方のニュース
  • コンピュータ ニュース
    • All
    • マイクロソフトコンピューター
    • 最新の apple ニュース
    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    GPT-4やPaLMなどの大規模言語モデルは規模が大きくなると突然 … – (ギガジン)

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    理研 国産初の量子コンピュータ公開 超伝導方式 ネットで公開し外部からの利用可能に | TBS NEWS DIG – TBS NEWS DIG Powered by JNN

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    ChatGPTとMicrosoft 365 Copilotが話題、3月注目のデジタルネタを3本 … – GetNavi web

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    Windows 11に潜むSnipping Toolの脆弱性 Microsoftが修正するも … – エンタープライズ

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    国産初の量子コンピューターがいよいよ稼働へ 高まる期待 – 東日本放送

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    初の国産量子コンピュータ、クラウドサービスとして提供 オンラインで64量子ビット計算機を活用可能に(2023年3月24日)| –

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    初の国産量子コンピュータ、クラウドサービスとして提供 オンラインで64量子ビット計算機を活用可能に – NEWS

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    見出しでわかる IT界隈・今週の重要ニュース:全113本[2023/3/16 … – INTERNET Watch

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    初の国産量子コンピューター稼働へ クラウド経由で利用―理研など – 時事通信ニュース

  • パソコンの比較
  • ゲーム
  • ビデオ
  • 製品動向
No Result
View All Result
  • ITニュース
  • 地方のニュース
  • コンピュータ ニュース
    • All
    • マイクロソフトコンピューター
    • 最新の apple ニュース
    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    GPT-4やPaLMなどの大規模言語モデルは規模が大きくなると突然 … – (ギガジン)

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    理研 国産初の量子コンピュータ公開 超伝導方式 ネットで公開し外部からの利用可能に | TBS NEWS DIG – TBS NEWS DIG Powered by JNN

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    ChatGPTとMicrosoft 365 Copilotが話題、3月注目のデジタルネタを3本 … – GetNavi web

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    Windows 11に潜むSnipping Toolの脆弱性 Microsoftが修正するも … – エンタープライズ

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    国産初の量子コンピューターがいよいよ稼働へ 高まる期待 – 東日本放送

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    初の国産量子コンピュータ、クラウドサービスとして提供 オンラインで64量子ビット計算機を活用可能に(2023年3月24日)| –

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    初の国産量子コンピュータ、クラウドサービスとして提供 オンラインで64量子ビット計算機を活用可能に – NEWS

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    見出しでわかる IT界隈・今週の重要ニュース:全113本[2023/3/16 … – INTERNET Watch

    新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

    初の国産量子コンピューター稼働へ クラウド経由で利用―理研など – 時事通信ニュース

  • パソコンの比較
  • ゲーム
  • ビデオ
  • 製品動向
No Result
View All Result
Mayaweb.jp
No Result
View All Result

‘Inaudible’ watermark could identify AI-generated voices • TechCrunch

2月 1, 2023
in 地方のニュース
4 min read
‘Inaudible’ watermark could identify AI-generated voices • TechCrunch

The growing ease with which anyone can create convincing audio in someone else’s voice has a lot of people on edge, and rightly so. Resemble AI’s proposal for watermarking generated speech may not fix it in one, but it’s a step in the right direction.

AI-generated speech is being used for all kinds of legitimate purposes, from screen readers to replacing voice actors (with their permission, of course). But as with nearly any technology, speech generation can be turned to malicious ends as well, producing fake quotes by politicians or celebrities. It’s highly desirable to find a way to tell real from fake that doesn’t rely on a publicist or close listening.

Watermarking is a technique by with an image or sound is imprinted with an identifiable pattern that shows its origin. We’ve all seen obvious watermarks like a logo on an image, but not all of them are so noticeable.

In images, a hidden watermark may hide the pattern at a pixel-by-pixel level, leaving the image looking unmodified to human eyes but identifiable to a computer. Same for audio: an occasional quiet sound encoding the information might not be something a casual listener would hear.

The trouble with these subtle watermarks is that they tend to be obliterated by even minor modifications to the media. Resize the image? There goes your pixel-perfect code. Encode the audio for streaming? The secret tones are compressed right out of existence.

Resemble AI is among a new cohort of generative AI startups aiming to use finely tuned speech models to produce dubs, audiobooks, and other media ordinarily produced by regular human voices. But if such models, perhaps trained on hours of audio provided by actors, were to fall into malicious hands, these companies may find themselves at the center of a PR disaster and perhaps serious liability. So it’s very much in their interest to find a way to make their recordings both as realistic as possible and also easily verifiable as being generated by AI.

PerTh is Resemble’s proposed watermarking process for this purpose, an awkward combination of “perceptual” and “threshold.”

“We have developed an additional layer of security that uses machine learning models to both embed packets of data into the speech content that we generate, and recover said data at a later point,” the company writes in a blog post explaining the technology. “Because the data is imperceptible, while being tightly coupled to the speech information, it is both difficult to remove, and provides a way to verify if a given clip was generated by Resemble. Importantly, this ‘watermarking’ technique is also tolerant of various audio manipulations like speeding up, slowing down, converting to compressed formats like MP3, etc.”

It relies on a quirk of how humans process audio, by which tones with high audibility essentially “mask” nearby tones of lesser amplitude. So if someone laughs and it produces peaks at the 5,000 Hz, 8,000 Hz, and 9,200 Hz frequencies, you can slip in structured tones that occur simultaneously within a few hertz, and they’ll be more or less imperceptible to listeners. But if you do it right, they’ll also be robust against removal since they are very close to an important part of the audio.

Here comes the diagram:

Diagram showing how lesser tones are “masked” by nearby peaks.

It’s intuitive but the challenge was no doubt creating a machine learning model that can locate candidate waveform sections and automatically produce the appropriate, yet inaudible, audio tones that carry the identifying information. Then it has to reverse that process while remaining robust to common sound manipulations like those mentioned above.

Here are two examples they provided. See if you can figure out which one is watermarked. Hover here to see the answer in your status bar.

同種の記事

Just 7 days until the TC Early Stage early bird flies away

Rocket Lab reveals big supplier deal with mystery mega constellation customer


https://techcrunch.com/inc/uploads/2023/02/resemble-perth-original.wav

https://techcrunch.com/inc/uploads/2023/02/resemble-perth-watermarked.wav

I can’t tell the difference and even inspecting the waveforms pretty closely I wasn’t able to find any obvious anomalies. I’m not handy enough with a spectrum analyzer these days to really get in there, but I suspect that’s where you might see something. At any rate if their claim that data indicating generation by Resemble is encoded more or less irreversibly into one of these clips, I’d say it’s a success.

PerTh will soon roll out to all of Resemble’s customers, and to be clear right now it only can mark and detect the company’s own generated speech. But if they did it, others probably will too — and chances are these engines will soon be inextricably linked to the speech generation models themselves. Malicious actors will always find a way around such things, but putting barriers in place ought to help curb some of that behavior.

Audio is special in this way, though, and similar tricks won’t work for text or images. So expect to remain in the uncanny valley for a while in those domains.

クレジットソースリンク

ShareTweet

関連記事

Just 7 days until the TC Early Stage early bird flies away
地方のニュース

Just 7 days until the TC Early Stage early bird flies away

3月 24, 2023
Rocket Lab reveals big supplier deal with mystery mega constellation customer
地方のニュース

Rocket Lab reveals big supplier deal with mystery mega constellation customer

3月 24, 2023
Fortra told breached companies their data was safe
地方のニュース

Fortra told breached companies their data was safe

3月 24, 2023
As banks totter, crypto is busy racking up gains
地方のニュース

Not-so-fake dry powder, AI and the future of DAOs

3月 24, 2023

探す

No Result
View All Result

最近のニュース

新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

「フォーメーションZ」から発展したゲームシステムや演出に注目。「Project : FZ」試遊レポート – 4Gamer.net

3月 25, 2023
新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

[GDC 2023]Windowsの新ファイルシステム「DirectStorage」で … – 4Gamer.net

3月 25, 2023
新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

3/25 中日 vs 千葉ロッテ ゲームハイライト – スポーツナビ「ゲーム … – スポーツナビ

3月 25, 2023
Intel co-founder Gordon Moore has passed away

Intel co-founder Gordon Moore has passed away

3月 25, 2023
新キャラ登場!『ULTRAMAN』FINALシーズン、ティザーPV公開 –

[GDC 2023]より優れたPCゲームをデザインするために,TRPG … – 4Gamer.net

3月 25, 2023
Mayaweb.jp

IT(情報技術)を始めとする、テクノロジー関連の最新情報やコラムはこちら。日常生活に欠かせないスマートフォン情報から、最新技術にまつわる記事まで、幅広い情報をお届けします。

最近のニュース

  • 「フォーメーションZ」から発展したゲームシステムや演出に注目。「Project : FZ」試遊レポート – 4Gamer.net
  • [GDC 2023]Windowsの新ファイルシステム「DirectStorage」で … – 4Gamer.net
  • 3/25 中日 vs 千葉ロッテ ゲームハイライト – スポーツナビ「ゲーム … – スポーツナビ

今すぐ購読

Loading
  • Advertise
  • お問い合わせ
  • 個人情報保護方針

© mayaweb.jp - 全著作権所有!

No Result
View All Result
  • ITニュース
  • 地方のニュース
  • コンピュータ ニュース
  • パソコンの比較
  • ゲーム
  • ビデオ

© mayaweb.jp - 全著作権所有!