DALL·E 2 என்றால் என்ன? எடுத்துக்காட்டுகளுடன் ஆரம்பநிலைக்கான விளக்கம்

Cto Takoe Dall E 2 Ob Asnenie Dla Nacinausih S Primerami



DALL·E 2 என்றால் என்ன?

DALL·E 2 என்பது ஒரு செயற்கை நுண்ணறிவுத் திட்டமாகும், இது வியாழன் அன்று OpenAI எனும் ஆராய்ச்சி நிறுவனத்தால் வெளிப்படுத்தப்பட்ட உரை விளக்கங்களிலிருந்து படங்களை உருவாக்குகிறது.





இது GPT-3 மின்மாற்றி மாதிரியின் 12-பில்லியன் அளவுரு பயிற்சி பதிப்பைப் பயன்படுத்துகிறது, இது இயற்கையான மொழி உள்ளீடுகளை விளக்குவதற்கும் தொடர்புடைய படங்களை உருவாக்குவதற்கும் பயன்படுத்துகிறது எடுத்துக்காட்டாக, 'ஒரு சிறிய நாயின் கருப்பு மற்றும் வெள்ளை புகைப்படம்' என்ற வாக்கியத்தை வழங்கியபோது, ​​அது சிவாவாவின் கருப்பு மற்றும் வெள்ளை படத்தை சரியாக வழங்கியுள்ளது.





சிஸ்டம் சரியானதாக இல்லை - சில சமயங்களில் விளக்குவதற்கு கடினமாக இருக்கும் அல்லது முற்றிலும் குறியீடான படங்களை உருவாக்குகிறது. எடுத்துக்காட்டாக, 'ஒரு நபர் எரிமலையின் மீது இறுக்கமான கயிற்றில் யூனிசைக்கிள் ஓட்டுகிறார்' என்ற படத்தை உருவாக்குமாறு கேட்டபோது, ​​அது ஒரு (அழகானது, என் கருத்துப்படி) முன்புறத்தில் ஒரு சிறிய உருவத்துடன் தண்ணீருக்கு மேல் சூரிய அஸ்தமனத்தின் முற்றிலும் தொடர்பில்லாத படத்தை உருவாக்கியது. .





இருப்பினும், முடிவுகள் சுவாரஸ்யமாக உள்ளன, மேலும் ஓபன்ஏஐ கூறுகையில், DALL·E 2 'தொழில்முறை மனித கலைஞர்களின் தரத்திற்கு போட்டியாக இருக்கும் உரை விளக்கங்களிலிருந்து படங்களை உருவாக்கும் முதல் AI மாடல்.'



இந்த அமைப்பு டெக்ஸ்ட்-இமேஜ் ஜோடிகளின் தரவுத்தொகுப்பில் பயிற்றுவிக்கப்பட்டது, இதில் சுமார் 1.3 மில்லியன் படங்கள் மற்றும் இணையத்தில் உள்ள தலைப்புகள் OpenAI ஆல் ஸ்கிராப் செய்யப்பட்டு க்யூரேட் செய்யப்பட்டன. பயிற்சி தரவு பின்னர் GPT-3 மாதிரியை நன்றாக மாற்றியமைக்க பயன்படுத்தப்பட்டது, இதனால் அது உரை விளக்கங்களிலிருந்து படங்களை உருவாக்க முடியும்.

ஓபன்ஏஐ அமைப்பு, சுருக்கமான, உறுதியான அல்லது கவிதை போன்ற பலவிதமான உரை விளக்கங்களிலிருந்து 'உயர்தர' படங்களை உருவாக்க முடியும் என்று கூறுகிறது.

சிஹுவாஹுவா உதாரணத்திற்கு கூடுதலாக, DALL·E 2 ஆல் தயாரிக்கப்பட்ட படங்களின் மற்ற எடுத்துக்காட்டுகளில் அடால்ஃப் ஹிட்லரின் உருவப்படம், காய்கறிகளால் செய்யப்பட்ட டிராகனின் படம் மற்றும் சிற்றுண்டியால் செய்யப்பட்ட மோனாலிசாவின் படம் ஆகியவை அடங்கும்.



இந்த அமைப்பு, 'ஃப்ளோஃப்' (உருவாக்கப்பட்ட விலங்கு) அல்லது 'துல்பா' (ஒரு சிந்தனை வடிவம்) போன்ற இல்லாத விஷயங்களின் படங்களையும் உருவாக்க முடியும்.

ஒட்டுமொத்தமாக, முடிவுகள் சுவாரஸ்யமாக உள்ளன, மேலும் இந்த அமைப்பு 'உரை விளக்கங்களிலிருந்து படங்களை உருவாக்குவதற்கான புதிய சாத்தியங்களைத் திறக்கிறது' என்று OpenAI கூறுகிறது.

இ 2 இலிருந்து இது CLIP-அமைப்பு உரைத் தகவலை காட்சித் தகவலாக மாற்றுகிறது. இது ஒரு குறியாக்கி-குறிவிலக்கி முன்னுதாரணமாகும், அதாவது உள்ளீட்டு உரை வழங்கப்படும் போது, ​​​​அது முதலில் இயந்திர உள்ளீடாக மாற்றப்படுகிறது, பின்னர் கணினியால் செயலாக்கப்படுகிறது, மேலும் இறுதியாக குறியிடப்பட்ட தரவை ஒரு படமாக மாற்றும் டிகோடருக்கு அனுப்பப்படுகிறது.

DALL E 2 என்றால் என்ன

DALL·E 2 என்றால் என்ன?

இது DALL·E இன் சமீபத்திய தலைமுறையாகும், இது முற்றிலும் புதிய காட்சி விளைவுகளை உருவாக்க சொற்றொடர்களைப் பயன்படுத்தும் ஒரு உருவாக்கும் மொழி மாதிரி. DALL E 2 ஒரு பெரிய 3.5V மாடலாகும், இருப்பினும் GPT-3 போல பெரியதாக இல்லை. சுவாரஸ்யமாக, இது அதன் முன்னோடி (12B) விட இலகுவானது. விளக்கச் சீரமைப்பு மற்றும் ஒளியியலின் அடிப்படையில், DALL·E 2 அதன் பெரிய அளவு இருந்தபோதிலும் DALL·E 2 ஐ விட 70% சிறந்தது.

DALL.E 2- ஆரம்பநிலைக்கான எடுத்துக்காட்டுகளுடன் விளக்கம்

குறிப்பாக, DALL·E 2 என்பது ஒரு படிநிலை நிபந்தனை உரை பட தொகுப்பு மாதிரியாகும், இது இயற்கை மொழி செயலாக்கத்திற்கான ஆழமான கற்றலையும் படத்தை உருவாக்குவதற்கான கணினி பார்வையையும் இணைக்கிறது. அதன் குறிக்கோள் இரண்டு மாடல்களைப் பயிற்றுவிப்பதாகும், மேலும் பயிற்சித் தொகுப்பில் ஜோடி படங்கள் மற்றும் விளக்கங்கள் உள்ளன. முதலாவதாக, எழுதப்பட்ட தலைப்பு கொடுக்கப்பட்டால், CLIP படத்தை உட்பொதிக்கப் பயிற்சியளிக்கப்படும். CLIP படத்தை உட்பொதிக்கும்போது (மற்றும் தலைப்பு இருந்தால்), பயிற்சியளிக்கப்பட்ட படத்தை உருவாக்கக்கூடிய டிகோடர் எங்களிடம் உள்ளது.

DALLE 2 ஆனது நூற்றுக்கணக்கான மில்லியன் புகைப்படங்களைப் பயன்படுத்தி இணையத்தில் இருந்து தலைப்புகளுடன் பயிற்சியளிக்கப்பட்டது, மேலும் அந்த மாதிரிகள் என்ன கற்றுக்கொள்கிறது என்பதை மாற்ற அந்த படங்களில் சில அகற்றப்பட்டு மாற்றியமைக்கப்படுகின்றன. இது பல பட விருப்பங்களை மீட்டெடுக்கிறது CLIP இணைப்புகள் பின்னர் அதைப் பயன்படுத்தவும் குறிவிலக்கி அவை ஒவ்வொன்றின் வழியாகவும் செல்லுங்கள். இது பயனரின் உள்ளீட்டின் அடிப்படையில் அனைத்து தகவல்களின் சுவாரஸ்யமான கலவையை உருவாக்குகிறது.

உதாரணம் DALL IS 2

DALL·E ஐ புரிந்து கொள்ள ஒரு சிறிய விளையாட்டை விளையாடுவோம். அதை அடுத்த மூன்று படிகளாகப் பிரிப்போம்.

  1. வானவில், மேகங்கள் மற்றும் யூனிகார்ன்கள் நீல வானத்தில் பறப்பதை கற்பனை செய்து பாருங்கள். உங்கள் கற்பனையில் ஒரு படம் எப்படி இருக்கும் என்று கற்பனை செய்து பாருங்கள். உட்பொதிக்கப்பட்ட ஒரு படத்தின் சரியான அனலாக்ஸுக்கு மக்கள் மிக நெருக்கமான விஷயம், உங்கள் தலையில் தோன்றிய படம் அதற்கு ஒரு சிறந்த எடுத்துக்காட்டு. இறுதி தயாரிப்பு பற்றி மட்டுமே நீங்கள் யூகிக்க முடியும், ஆனால் என்ன சேர்க்கப்பட வேண்டும் என்பது பற்றி உங்களுக்கு நல்ல யோசனை உள்ளது. ஒரு ப்ரியோரி மாடல் வாசகரை ஒரு சொற்றொடரில் உள்ள வார்த்தைகளிலிருந்து அவரது கற்பனையில் ஒரு காட்சிக்கு அழைத்துச் செல்கிறது.
  2. இப்போது நீங்கள் வரைய ஆரம்பிக்கலாம். UnCLIP செய்வது உங்கள் மனப் படத்தை உண்மையான ஓவியமாக மாற்றுவதாகும். இப்போது நீங்கள் அதே விளக்கத்திலிருந்து, அதே அடிப்படை புள்ளிவிவரங்களுடன், ஆனால் முற்றிலும் புதிய காட்சி பாணியுடன் மற்றொரு எழுத்தை துல்லியமாக மீண்டும் உருவாக்கலாம். DALL·E 2 இந்த வழியில் உட்பொதிக்கப்பட்ட ஏற்கனவே உள்ள படத்திலிருந்து தனிப்பட்ட படங்களையும் உருவாக்க முடியும்.
  3. நீங்கள் உருவாக்கிய ஓவியத்தில் கவனம் செலுத்துங்கள். 'மேகங்களுக்கு நடுவில் ஒரு யூனிகார்ன், மற்றும் வானத்தில் ஒரு வானவில் எழுகிறது' என்ற விளக்கத்தை நீங்கள் வரைந்தால் இதுதான் நடக்கும். மற்றதை (சூரியன், வீடு, மரம், முதலியன) எது சிறப்பாக விளக்குகிறது மற்றும் பொருள், நடை, வண்ணங்கள் போன்றவற்றை சிறப்பாக விளக்குவது எது என்பதைத் தீர்மானிக்க இப்போது படம் மற்றும் உரையை ஆராயவும். CLIP செய்வது பண்புகளை குறியாக்கம் செய்வதாகும். உரை மற்றும் படங்கள்.

DALL-E என்றால் என்ன என்பதை இப்போது தெரிந்து கொண்டோம், அடுத்த பகுதிக்குச் சென்று அதன் அம்சங்களைப் புரிந்துகொள்வோம்.

உதவிக்குறிப்பு: DALL-E-2 AI சேவை மூலம் யதார்த்தமான படங்களை எவ்வாறு உருவாக்குவது

அம்சங்கள் DALL E 2

DALL·E 2 இன் விவரக்குறிப்புகள் கீழே உள்ளன.

  1. மாறுபாடுகள்
  2. வண்ணம் தீட்டுதல்
  3. உரை வேறுபாடுகள்

அவற்றைப் பற்றி விரிவாகப் பேசலாம்.

வார்த்தை 2010 இல் வணிக அட்டைகளை உருவாக்குவது எப்படி

1] மாறுபாடுகள்

DALL·E 2 ஒரு வாக்கியத்தை ஒரு படமாக மொழிபெயர்ப்பதைத் தாண்டியது. வலுவான CLIP உட்பொதிப்புகளுக்கு நன்றி, கொடுக்கப்பட்ட கையொப்பத்திற்கு வெவ்வேறு முடிவுகளை உருவாக்கும், உருவாக்கும் செயல்முறையுடன் OpenAI பரிசோதனை செய்யலாம். CLIP அதன் 'மனதில்' எதை 'பார்க்கிறது' என்பது உள்ளீட்டில் இருந்து முக்கியமானதாகக் கருதுகிறது (அனைத்து படங்களுக்கும் ஒரே மாதிரியாக இருக்கும்) மற்றும் எதை மாற்றலாம் (வெவ்வேறு படங்களுக்கு இது மாறுகிறது). முடிந்தவரை, DALL·E 2 'அர்த்தமுள்ள தகவல்... மற்றும் அழகியல் அம்சங்கள்' இரண்டையும் தக்க வைத்துக் கொள்ளும்.

2] வண்ணம் தீட்டுதல்

DALL·E 2 ஏற்கனவே உள்ள புகைப்படங்களை தானியங்கி நிரப்புதலுடன் மாற்றலாம். பின்வரும் எடுத்துக்காட்டில், இடது படம் அசல் படம், மற்றும் மையம் மற்றும் வலது புகைப்படங்கள் வெவ்வேறு இடங்களில் வரையப்பட்ட உறுப்பு. DALL·E 2 பட நடைக்கு கூடுதல் உறுப்புடன் பொருந்துகிறது. இது புதிய உறுப்பைப் பிரதிபலிக்கும் வகையில் அமைப்புகளையும் பிரதிபலிப்புகளையும் புதுப்பிக்கிறது.

படி : ChatGPT மூலம் நீங்கள் என்ன செய்யலாம்

3] உரை வேறுபாடுகள்

DALL·E 2 உரை வேறுபாடுகளைப் பயன்படுத்தி படங்களை மாற்றுகிறது. DALL·E 2 ஆனது மேம்பட்ட இடைக்கணிப்பு திறன்களைக் கொண்டுள்ளது, இது பொருட்களை மாற்ற உங்களை அனுமதிக்கிறது. ஒரு ட்விட்டர் பயனர் தனது ஐபோனை 'அன்மார்டனைஸ்' செய்ய முடிந்தது. twitter.com அதை சரிபார்க்க.

இந்த அம்சங்களை நீங்கள் விரும்பினால், நீங்கள் செய்ய வேண்டியது எல்லாம் openai.com பின்னர் பதிவு செய்யவும். நீங்கள் ஒரு புதிய கணக்கை உருவாக்கலாம் அல்லது ஏற்கனவே உள்ள Microsoft அல்லது Google கணக்குகளைப் பயன்படுத்தி பதிவுபெறலாம். நீங்கள் அதைச் செய்தவுடன், சில இலவச கிரெடிட்களைப் பெறுவீர்கள், மேலும் நீங்கள் விரும்பினால், அதற்கு நீங்கள் பணம் செலுத்த வேண்டும்.

இவை DALL·E 2 இன் சில அம்சங்களாகும், இது பல சிறந்த பயன்பாட்டு நிகழ்வுகளைக் கொண்டுள்ளது, இருப்பினும் AI கருவிகளை அதிகம் நம்பாமல் இருக்க எப்போதும் பரிந்துரைக்கப்படுகிறது. எல்லாவற்றிற்கும் மேலாக, அவை வேலையைச் செய்யப் பயன்படுத்தப்படும் கருவிகளைத் தவிர வேறொன்றுமில்லை, அவை ஒரு நபரின் உணர்ச்சி நுண்ணறிவை ஒருபோதும் மாற்ற முடியாது.

மேலும் படிக்க: சிறந்த டீப்ஃபேக் ஆப்ஸ், மென்பொருள் மற்றும் இணையதளங்கள்.

DALL E 2 என்றால் என்ன
பிரபல பதிவுகள்