Microsoft-un VALL-E haqqında bilmək istədiyiniz hər şey

Microsoft-un VALL-E haqqında bilmək istədiyiniz hər şey

Microsoft VALL-E – mətndən nitqə dəyişən süni intellekt modelini işləyib hazırlayıb ki, o, sadəcə 3 saniyəlik audio nümunəni dinləməklə istənilən səsi təqlid edir.

Oxumağa davam etməzdən əvvəl aydınlaşdırmaq istərdim ki, VALL-E WALL-E-dən fərqlidir. Bəzilərimiz hər iki sözü eyni şəkildə tələffüz etsə də, ikisi arasında çox fərq var. WALL-E 2008-ci ildə buraxılmış Disney-Pixar animasiyasıdır və içərisində sevimli və mehriban süni intellekt robotu var.

AI faktoru həqiqətən VALL-E və WALL- arasında oxşarlıqdır. E.

VALL-E Haqqında Nə Bilirik?

Texniki dildə Microsoft VALL-E-ni “Neyron Codec Dil Modeli” adlandırır. Daha sadə dildə desək, VALL-E mətn daxiletməsindən audio yarada, eləcə də təqdim edilən hər hansı audio nümunənin səsini təqlid edə bilən AI modelidir. Üç saniyə kimi qısa bir səs nümunəsini eşitməklə, hər hansı bir səsi təqlid edə bilər. VALL-E hələ ümumi ictimaiyyət üçün əlçatan deyil. O, təkcə səsə deyil, həm də məkanın əhval-ruhiyyəsinə və akustikasına uyğun ola bilər. Bir çox faydalı üsullarla tətbiq oluna bilməsinə baxmayaraq, bununla bağlı mənəvi problemlər var.

Təlim Modelləri –

Tədqiqatçılar Meta-nın LibriLight audio kitabxanasındakı 7000-dən çox insanla müqayisədə VALL-E-ni 60.000 saat ingilis dilində danışanlara öyrətdiklərini iddia edirlər. Təqlid olunmaq üçün hədəf spikerin səsi təlim məlumatlarına yaxından bənzəməlidir. Bu yolla, Al hədəf natiqin səsini təqlid etmək üçün "təlimindən" istifadə edə bilər.

Emosiyaları təqlid etmək –

Vurğulamaq lazımdır ki, Al modeli hündürlük, qabıq və teksturaya əlavə olaraq otağın akustikasını, həmçinin natiqin emosional tonunu simulyasiya edə bilər. Buna görə də, VALL-E hədəf səsi narahat edən kimi təqlid edəcək.

Microsoft-un tədqiqat qrupuna görə, “Təcrübələrin nəticələri VALL-E-nin daha yaxşı performans göstərdiyini göstərir. nitqin təbiiliyi və natiq bənzərliyi baxımından ən qabaqcıl sıfır atışlı TTS sistemindən daha yaxşıdır. Bundan əlavə, biz aşkar edirik ki, VALL-E "sintezi" zamanı natiqin emosiyasını və akustik çağırışın akustik kontekstini qoruya bilər.

Təhlükələr –

Al model robototexnika, media istehsalı və fərdi mətndən nitqə tətbiqlərə tətbiq edilə bilər. Ancaq düzgün istifadə edilmədikdə, təhlükə yarada bilər. Biznes xəbərdarlıq etdi modelin səs identifikasiyasını təqlid etmək və ya saxtalaşdırmaq üçün sui-istifadə edilə bilər, çünki VALL-E dinamik şəxsiyyətini qoruyarkən nitqi sintez edə bilər.

VALL-E, məsələn, qanuni görünən spam zəngləri yaratmaq üçün istifadə edilə bilər. insanları aldatmaq üçün. Siyasətçilər və ya hörmətli sosial varlığı olan hər kəs də saxtakarlıqla nümayiş etdirildiyi kimi, təqlid olunmağa həssasdır. Təhdidlər nitq əmrlərinə və ya səs parollarına ehtiyacı olan proqramlardan istifadə edən istifadəçilərə gələ bilər. Bundan əlavə, səs aktyorlarının işləri VALL-E ilə aradan qaldırıla bilər.

Etik Vəzifə –

Bundan əlavə, biznes “Bu işdəki sınaqlar modelin istifadəçisinin hədəf natiq olduğu və natiq tərəfindən qəbul edildiyi fərziyyəsi altında həyata keçirilmişdir” ifadəsi ilə etika ilə bağlı bəyanatı ehtiva edir. Dinamikin dəyişikliyi yerinə yetirməyə razı olmasını təmin etmək üçün protokol və dəyişdirilmiş nitqi aşkar etmək üçün sistem, model bütün dinamiklər üçün ümumiləşdirildikdə, səs redaktə modellərinə daxil edilməlidir.

VALL necədir. -E DALL-E-dən fərqlidir?

DALL-E mətn təsvirlərindən qrafiklər yaradan OpenAI tərəfindən yaradılmış maşın öyrənmə modelidir. Bu mətndən şəkilə təsvirləri təsvir etmək üçün göstərişlərdən istifadə olunur. Alqoritmin real görüntülər yaratması üçün sadəcə səhnənin təsviri kifayətdir. DALL-E, istifadəçi tərəfindən verilən qısa sözlərdən dəqiq təsvirlər yaradan neyron şəbəkə texnikasıdır. O, mətn təsvirlərindən istifadə edərək dili öyrənir və istifadəçilərin və tərtibatçıların məlumat dəstlərinə töhfə verdikləri “öyrənmə” datasından istifadə edir.

VALL-E haqqında nə düşünürsünüz?

Ümid edirik ki, indi siz DALL-E (mətndən şəkilə) ilə müqayisədə VALL-E (mətndən səsə) haqqında hər şeyi bilirsiniz. VALL-E-nin nə vaxt istifadəyə veriləcəyi və geniş ictimaiyyət tərəfindən istifadəyə veriləcəyi ilə bağlı dəqiq bir tarix yoxdur. DALL-E-yə gəldikdə isə, o, artıq hamı üçün əlçatan olub.

Suallarınız və ya tövsiyələriniz varsa, aşağıdakı şərhlərdə bizə bildirin. Biz sizə bir qətnamə təqdim etməkdən məmnun olarıq. Biz tez-tez məsləhətlər, fəndlər və ümumi texnoloji problemlərin həlli yollarını dərc edirik. Siz bizi Facebook, Twitter, YouTube, Instagram, Flipboard və Pinterest-də də tapa bilərsiniz.

oxumaq: 0

yodax