Մայքրոսոֆթ НМТ թարգմանիչ Microsoft-ի Bing нейронный մեքենա թարգմանություններ ամբողջական

Մայքրոսոֆթ НМТ թարգմանիչ Microsoft-ի Bing нейронный մեքենա թարգմանություններ ամբողջական
Нейронный մեքենա թարգմանություններ (НМТ) Դա օգտագործումը ինտելեկտի բարձր որակի մեքենայական թարգմանության ստանդարտ。 Նա փոխարինել է հին ոճով վիճակագրական մեքենա թարգմանություններ (ՍՄՏ) Տեխնոլոգիա,Տեխնոլոգիաներ 2010-2020 Միջին տարիքի, հասել է գագաթնակետին որակի 。
Համեմատ ՍՄՏ,НМТ կարող է ոչ միայն բուն որակի թարգմանության միավոր վիճակի է ապահովել լավագույն թարգմանությունը,և հնչում է ավելի հարթ、Ավելի շատ նման են մարդկանց。 Այս սահունություն գլխավոր պատճառն այն է, որ НМТ օգտագործում արտահայտությունը լրիվ համատեքստում թարգմանել բառը。 ՍՄՏ պարզապես հաշվի առնել յուրաքանչյուր խոսքերից աչքում եւ մի քանի բառերի ուղիղ համատեքստում。
Մոդել НМТ է API միջուկ,Անտեսանելի օգտագործողի。 Միակ ակնհայտ գերազանցության որակի բարելավումը թարգմանությունը ,Հատկապես չինացիների համար、Ճապոներեն եւ արաբերեն և այլ լեզուներ。
Ինչ մեքենա թարգմանություններ?
Համակարգեր, մեքենայական թարգմանության օգտագործումը տեխնոլոգիայի մեքենայական ուսուցման մեծ ծավալը տեքստի ցանկացած լեզու տեղափոխման դիմումի կամ օնլայն ծառայությունների。Ծառայությունը կլինի"աղբյուրը"տեքստը թարգմանվել է մեկ լեզվից մեկ այլ"նպատակային"լեզուն。
Թեեւ տեխնոլոգիաներ, մեքենայական թարգմանության համար հայեցակարգը և օգտագործել է իր ինտերֆեյսը համեմատաբար պարզ,Բայց գիտությունը և տեխնոլոգիան չափազանց բարդ է,Եւ առաջատար տեխնոլոգիաներ համատեղ,Հատկապես խորը ուսումնասիրությունը(արհեստական բանականություն),Մեծ տվյալներ,Լեզուն,Cloud computing եւ վեբ API。
2010 թվականի սկզբից,Նոր տեխնոլոգիան արհեստական ինտելեկտի,Այսինքն խորությունը, նյարդային ցանց, որը նաեւ հայտնի է որպես խորը ուսումնասիրությունը),Որպեսզի տեխնոլոգիա խոսքում հասել է այնպիսի մակարդակի որակի,Այնպես որ, թիմը Microsoft թարգմանիչ, խոսքի ճանաչման և այլ հիմնական տեքստը փոխանցման տեխնոլոգիան զուգորդվում,Վազում Է Մի Տեխնոլոգիա Խոսք 。Նոր տեխնոլոգիան ձայնային թարգմանությունը 。
Պատմություն,Արդյունաբերության մեջ օգտագործում են հիմնական մեթոդների, համակարգչային ուսուցման, դա վիճակագրական մեքենա թարգմանություններ(ՍՄՏ)。Մի քանի խոսք համատեքստում գործի,ՍՄՏ օգտագործում խորացված վերլուծություն, գնահատել խոսքերը ավելի լավ արդյունք թարգմանությունը 。Կեսերից 2000-ականներին սկսել է,Այդ թվում 'Microsoft-ը, այդ թվում' բոլոր խոշորագույն բյուրոյի փոխանցումների օգտագործում են ՍՄՏ。
Հայտնվի нейронный մեքենա թարգմանություններ(НМТ)առաջացնել թարգմանական արվեստի հիմնարար փոփոխությունը,Բարձրացնել որակը թարգմանությունը。Այդ տեխնոլոգիան թարգմանություն էր երկրորդ կեսին 2016 կսկսվի օգտվողների համար եւ մշակողների, պետք է տեղակայել 。
SMT եւ հնարքներ թարգմանության НМТ երկու բան:
  • Երկուսն էլ պահանջում են շատ дочеловеческой թարգմանությունը բովանդակության միլիոնավոր թարգմանված նախադասությունների համակարգում ուսուցման 。
  • Երկուսն էլ գործում է որպես երկլեզու բառարան,Սակայն, ըստ ցանկը հնարավոր թարգմանված բառեր,Սակայն, ըստ դատավճռի, օգտագործելով բառը համատեքստը թարգմանությունը。
Ինչ է Microsoft թարգմանիչ համար?
Ինչպես API հավաքածուի մի մասը,Microsoft թարգմանիչ տեքստը API եւ ծառայությունների Microsoft խոսքի ծառայության մեքենայական թարգմանության Microsoft-ի 。
Microsoft թարգմանիչը թարգմանել տեքստը
2007 թ.,Թիմը Microsoft էր օգտագործել Microsoft-ի translate API տեքստային,2011թ.,Այն օգտագործվում է որպես հաճախորդների API օգտագործել。MicrosoftTranslator տեքստը API, Microsoft-ի ներքին այն լայնորեն օգտագործվում է。Այն ինտեգրված է տեղայնացման արտադրանքի ,Աջակցել թիմին օնլայն կապի 。Կարող է լինել նաեւ ծանոթ ապրանքների。
Microsoft թարգմանիչը կարող է լինել ցանկացած հարթակ կայքում կամ հաճախորդի դիմումը, ինչպես նաեւ ցանկացած օպերացիոն համակարգի օգտագործման համար,Կատարման համար, թարգմանական եւ այլ լեզվական գործառնությունների,Օրինակ, ճանաչումը լեզվի ,Տեքստ է, խոսք կամ բառարան。
Օգտագործելով ստանդարտ տեխնոլոգիաների հանգստի ,Կառուցապատողներին տրամադրվելու նշելով նպատակային լեզվի պարամետրեր տեքստի բնօրինակի կամ փոխանցման մասին խոսք են ձայնային-ուղարկում ծառայություն,Ապա ծառայությունը պետք է թարգմանված տեքստը ուղարկվում է ետ հաճախորդը կամ վեբ-ծրագիրը օգտագործելու համար。
Ծառայությունը Microsoft թարգմանիչ տեղադրվում են տվյալների Կենտրոնում Microsoft ծառայությունում Azure,Եւ այլ ամպային ծառայությունների Microsoft-ը նույնպես ստանում է անվտանգությունը,Scalability,Հուսալիություն և շարունակական մատչելիությունը նպաստները。
Microsoft թարգմանիչ ձայնը թարգմանել
Տեխնոլոգիան Microsoft թարգմանիչ ձայնային թարգմանական թարգմանչի Skype-ով կսկսվի 2014թ. վերջին մեկնարկը ,Սկզբից 2016-ը գործարկել է որպես բաց API օգտագործման համար հաճախորդի կողմից 。Այն ինտեգրված է Microsoft-ի թարգմանիչ ֆունկցիան իրական ժամանակում,Skype-ի,Ուղիղ հավաքների Skype-ի Android-ի համար, եւ Microsoft-ի թարգմանիչ ծրագիրը,iOS և Windows。
Թարգմանության խոսքի խոսքը Մայքրոսոֆթ անել,Մայքրոսոֆթ ձայնը, դա լիովին customizable միջանցիկ սպասարկում,Խոսքի ճանաչման համար ,Ձայնային թարգմանիչ եւ ԱՌԵՒՏՐԻ կենտրոնում(տեքստի խոսքը)。
Թարգմանություն տեքստի, թե ինչպես պետք է աշխատել?
Թարգմանության համար տեքստը հիմնականում տեխնիկական, կա երկու:Ավանդական մեթոդները,Վիճակագրական մեքենա թարգմանություններ(ՍՄՏ)եւ տեխնոլոգիաների հաջորդ սերնդի,Որ нейронный մեքենա թարգմանություններ(НМТ)。
Վիճակագրական մեքենա թարգմանություններ
Microsoft թարգմանիչ հասնելու համար վիճակագրական մեքենայական թարգմանության(ՍՄՏ)կառուցել է Microsoft-ի ավելի քան տասնամյակների հետազոտությունների բնական լեզվի հիման վրա:。Ժամանակակից թարգմանություն համակարգի փոխարեն գրել հրահանգը կանոնները միջեւ լեզուներով թարգմանված,Բայց թարգմանություն համարվում է գոյություն ունեցող փոխանցումների մարդկային լեզվով ուսուցման միջեւ տեքստի վերափոխումը և օգտագործում " ծրագրի վիճակագրական և մեքենայական ուսուցման վերջին նվաճումների խնդրին。
Այսպես կոչված"զուգահեռ կորպուսը"մեծապես ծառայում է ժամանակակից Розеттский քար,Համատեքստում բազմաթիվ լեզվական զույգերի եւ тематик տրամադրել բառը,Արտահայտություններ եւ արտահայտություններ թարգմանությունը。Վիճակագրական մեթոդները, մոդելավորման և արդյունավետ ալգորիթմներ, որոնք կարող են օգնել համակարգիչներ լուծել վերծանել սահմանումը ուսուցողական տվյալների original լեզվով եւ անգլերեն թարգմանության միջեւ համապատասխան հարաբերությունների հաշտեցումը կոդ գտնել նոր մուտքի առաջարկները, լավագույն թարգմանության հարցեր。Թարգմանիչ վիճակագրական մեթոդների Microsoft լեզվաբանական տեղեկատվության,Որպեսզի արտադրել լավագույն ամփոփումը եւ հանգեցնում է ավելի հեշտ է հասկանալ թարգմանությունը մոդել。
Քանի որ այս մեթոդը ոչ ապավինել բառարան, կամ քերականության կանոնները,Ուստի այն ապահովում է լավագույն արտահայտությունը թարգմանությունը,Այս բառը օգտագործել ընդամենը համատեքստում, այլ ոչ թե փորձում է կատարել մի խոսք թարգմանությունը。Թարգմանության համար բառի,Մշակվել է երկլեզու բառարան。
Нейронный մեքենա թարգմանություններ
Մշտական կատարելագործումը թարգմանությունը շատ կարեւոր է。Բայց,2010 թվականի կեսերին,Տեխնոլոգիան SMT, արտադրողականության բարձրացման եղել է կայուն վիճակում。Շնորհիվ օգտագործման Մայքրոսոֆթ Հայ սուպեր համակարգիչը, հատկապես Microsoft когнитивный գործիքներ կշեռքներ և գործառույթները,Թարգմանիչ Մայքրոսոֆթ այժմ ապահովում հիման վրա նյարդային ցանցի(թարգմանությունը ЛСТМ ,Այնպես որ թարգմանության որակը բարելավվել է նոր տասնամյակ。
Այդ нейросетевых մոդելների հասանելի միջոցով բառերը Microsoft եւ օգտագործել ID կատեգորիաներ տեքստի, API ի բոլոր ձայնային լեզուն。
Ավանդական ՍՄՏ համեմատ,Нейронная ցանց դարձի ճանապարհ կատարման սկզբունքորեն տարբեր。
Հաջորդ անիմացիոն ցույց է տալիս нейронная ցանցը թարգմանությունը թարգմանության փորձի յուրաքանչյուր քայլ。Այս մեթոդի,Թարգմանություն դնել բոլոր առաջարկը համատեքստում,Փոխարեն մեթոդիկայի ՍՄՏ, օգտագործելով միայն մի քանի բառ сползая պատուհաններ,Եւ կարող է արտադրել ավելի ազատ եւ մարդկային թարգմանությունը。
Հիման վրա ուսուցման նյարդային ցանցում ,Բոլոր բառերը երկայնքով 500-мерный վեկտոր կոդավորման,Векторное ներկայացում կոնկրետ զույգ լեզուներով, ինչպիսիք են անգլերեն և չինարեն և նրա առանձնահատկությունները。Կախված լեզվի ուսուցման,Нейронная ցանցը կարգավորել այդ չափերը պետք է լինի。Նրանք կարող են լինել կոդավորում է որոշ պարզ հասկացությունները,Օրինակ, սեռը իգական,Տղամարդիկ,Չեզոք),Աստիճան, քաղաքավարություն լեզվի ,Ազատ զգալ,Գրված է,Ձեւը եւ այլն:,Մուտքագրեք բառը: բայ,Գոյական անուն և այլն:,Ինչպես նաեւ ցանկացած այլ неочевидные մանավանդ ուսուցողական ստացված տվյալների。
Нейронная ցանցը թարգմանությունը փորձ կատարեք հետևյալ գործողությունները:
  • Յուրաքանչյուր բառը,Կամ, ավելի ճիշտ, իր 500-мерный վեկտոր,Բոլոր միջոցով"neuron"առաջին շերտի,Այն առաջարկի այլ կերպ ասած համատեքստում խոսքը 1000-мерный վեկտոր B նրա կոդավորում。
  • Այն բանից հետո, ինչպես բոլոր բառերը ինչ-որ закодированное այդ 1000-мерный վեկտոր է,Այս գործընթացը կարող է կրկնվել մի քանի անգամ,Յուրաքանչյուր շերտ կարող է ավարտված առաջարկը համատեքստում ավելի ճշգրտում բառերը 1000-мерном ներկայացման տեխնոլոգիա SMT, ընդհակառակը, կարող է քննել միայն 3-ից 5 դուռ Word
  • Այդ ժամանակ,Խնդրում ենք նկատի ունենալ, որ շերտ, այսինքն ' ծրագրային ալգորիթմ կլինի օգտագործել վերջնական եզրակացություն մատրիցայի,Շերտը ուշադրությանը պետք է օգտագործել այս վերջին հանգստյան օր է մեռնում, եւ ավելի վաղ թարգմանված ելքային բառը որոշելու համար հաջորդ սլաքները պետք է տանել նախնական առաջարկը, որում խոսք。Այն նաեւ պետք է օգտագործել այդ հաշվարկները պոտենցիալ թողնել լեզվի ավելորդ բառեր。
  • Թարգմանություն շերտը decoder առավել հարմար թիրախ լեզուն կազմում է լեզվի թարգմանության ընտրված բառերը, կամ ավելի կոնկրետ,Լրիվ համատեքստը արտահայտություն, ցույց է տալիս, որ 1000-мерный վեկտոր。Եւ ապա վերջին շերտը հետադարձ կապից դուրս գալու համար համապատասխան շերտի,Որպեսզի հաշվարկել համապատասխան թարգմանությունը նախնական առաջարկները, որտեղ հաջորդ բառը。

Անիմացիայի ցույց է տրված Օրինակում,Համատեքստ 1000-ծավալային մոդելներ" է "закодирован գոյական տունը ֆրանսերեն տուն կանանց խոսքերը。Դա թույլ կտա ճիշտ թարգմանության համար", "պետք է" քաշեք", իսկ" երաժշտություն "կա միակ թվում,Արական կամ" անտառ "է հոգնակի մակարդակի հասնելուց հետո դարձի дешифратора 。
Խնդրում ենք նկատի ունենալ, որ ալգորիթմը հիմնված է լինելու ավելի վաղ թարգմանված խոսքը տվյալ դեպքում" նկատմամբ պարզել են, թե,Կողքին փոխանցումով խոսքերը պետք է լինի թեմա է" տուն "- ի փոխարեն прилагательного" կապույտ ") 。Պատճառը այդ նպատակը կարող է ձեռք բերվել,Քանի որ համակարգը հասկանում է անգլերեն եւ ֆրանսերեն լեզուներով կդառնան գլխիվայր շուռ տված այս խոսքերը առաջարկները համար。Դուք կարող եք նաեւ հաշվարկել,Եթե ածական" մեծ", այլ ոչ թե գույն,Այն պետք է վերացնել նրանց:" մեծ տուն " =>"լա Գրանդ Мэзон", իսկ。
Շնորհիվ այդ մեթոդի օգտագործման,Շատ դեպքերում,Ամփոփիչ թողարկման գործակիցը ՍՄՏ-ավելի հարթ թարգմանությունը,Մոտենում է մարդու թարգմանությունը。
Ձայնային թարգմանության, թե ինչպես պետք է աշխատել?
Microsoft թարգմանիչ նաեւ կարող է թարգմանել ձայնը。Տեխնոլոգիաների թարգմանչի իրական ժամանակում ֆունկցիան,Ծրագիրը թարգմանիչ ,Թարգմանիչ Skype-ը բացահայտվել է,Եւ ի սկզբանե միայն մի գործառույթ է թարգմանչի Skype-ի, ինչպես նաև iOS և Android Microsoft թարգմանիչ ծրագիրը ապահովում է այս գործառույթն。Այժմ մշակողները կարող են օգտագործել պորտալը ապահովում է Azure վերջին տարբերակը մնացած հիման վրա, բաց API զարգացման համար。
Թեեւ առաջին հայացքից են նախորդող տեխնիկայի մակարդակի հիման վրա կառուցել տեխնոլոգիաների փոխանցման խոսք, կարծես թե պարզ գործընթացը,Բայց դա պետք է անել, քան գոյություն ունեցող"ավանդական"մարդ-մեքենա" խոսքի ճանաչման պարզապես տեղադրված է գոյություն ունեցող տեքստը շատ ավելի。Թարգմանություն。
Որպեսզի"աղբյուրը"ձայները մեկ լեզվով ճիշտ թարգմանել այն մեկ այլ"նպատակային"լեզուն,Համակարգը պետք է անցնի չորս քայլ。
  • Ճանաչումը խոսք ,Փոխարկել աուդիո տեքստը
  • TrueText:Microsoft-Ի Տեխնոլոգիան ,Կարող կարգավորման համար տեքստը, որպեսզի այն ավելի հարմար թարգմանությունը
  • Տեքստը մեքենայական թարգմանության թարգմանության համար,Բայց օգտագործելով հատուկ մշակված համար իրական խոսակցական երկխոսությունների, զարգացման թարգմանական մոդելի
  • Անհրաժեշտության դեպքում, փոխարկում տեքստի փոխակերպման մասին է խոսքը,Ստեղծման համար թարգմանության աուդիո。

Ավտոմատ ճանաչում խոսք, ավտոմատ ճանաչում խոսքում)
Օգտագործելով обученной նյարդային ցանցի համակարգի(NN)կատարման համար ավտոմատ խոսքի ճանաչման ACP),Համակարգը կարող է վերլուծել հազար ժամ աուդիո ձայնը。Մոդելը հիմնված փոխգործակցության մարդկանց միջեւ, այլ ոչ թե մարդիկ մեքենայի թիմի համար մարզումները,Այսպիսով, կանոնավոր երկխոսության, օպտիմիզացված համար խոսքի ճանաչման。Այդ նպատակին հասնելու համար,Ավանդական "մարդ-մեքենա" ACP համեմատ,Պետք է ավելի շատ տվյալներ ու ավելի ДНН。
TrueText
Երբ մարդիկ այլ մարդկանց հետ շփվելիս:,Մեր խոսքերը ոչ թե այնպես, ինչպես մենք սովորաբար մտածում ենք որպես կատարյալ,Հստակ ու կոկիկ。Տեխնոլոգիայի միջոցով TrueText ,Վերացնելով ձայնը տարբերությունը լրացնելու բառը, օրինակ," միտքը","ախ","ա","ինչպես",заикается եւ կրկնում է。Ավելացնելով ժամանակաշրջանի,Punctuations եւ заглавные տառերը,Դուք նաեւ կարող եք բարելավել readability տեքստի և թարգմանությունը。Ստանալու համար այս արդյունքները,Օգտագործելով տասնամյակ լեզվական տեխնոլոգիաների աշխատանքները,Սա թարգմանչի զարգացած,Օգտագործվում է ստեղծել TrueText。Հաջորդ նկարում միջոցով իրական օրինակ է նկարագրել TrueText տարբեր դարձի ստանդարտացման տվյալ տեքստը。

Թողնել մեկնաբանություն