Skip to main content
بلاگ

ایده های جذاب پروژه با استفاده از مدل‌های زبانی بزرگ

By ژوئن 19, 2023آگوست 20th, 2023No Comments

با ظهور مدل‌های زبانی بزرگ یا (Large Language Models (LLMs به شکل مدل‌های پایه پیش‌آموزش‌داده شده، مانند GPT-3 از OpenAI، فرصت‌های بی‌نهایتی برای پیاده سازی ایده های جالب پروژه با استفاده از این مدل‌ها وجود دارد. و با ظهور ابزارهای توسعه دهندگان، مانع فنی کمتر شده است.

در ادامه ۹ ایده جذاب که از مدل‌های زبانی بزرگ برای وظایف پایین‌دست استفاده می‌کنند، معرفی می کنیم:

  • نوشتن خودکار متن نامه
  • چت‌بات با شخصیت مجازی
  • خلاصه‌کننده ویدیوهای یوتیوب
  • استخراج اطلاعات از آگهی‌های استخدامی
  • وب اسکریپر سفارشی
  • پایگاه داده‌ی قابل جستجوی اسناد
  • پاسخ به سوالات با استفاده از متن سند
  • دسته‌بندی پست‌های شبکه‌های اجتماعی و قسمت‌های مختلف پادکست
  • دسته‌بندی درخواست‌های کسب و کار از طریق ایمیل

پروژه‌های مبتنی بر تولید متن

مدل های زبانی بزرگ(LLMs) یا ابر مدل های زبانی بیشتر به دلیل قابلیت‌های تولیدی خود مشهور هستند. در این بخش، ابتدا چند ایده پروژه مبتنی بر موارد کاربردی مربوط به آن‌ها را بررسی خواهیم کرد:

  1. ایجاد کننده: تولید متن نامه
  2. محاوره ای: چت‌بات با شخصیت مجازی
  3. خلاصه‌سازی: خلاصه‌کننده ویدیوهای یوتیوب
  4. استخراج: استخراج اطلاعات از آگهی‌های استخدامی
  5. بازنویسی: وب اسکریپر سفارشی

ایده پروژه ۱: تولید متن نامه (مثلا نامه درخواست)

تولید متن نامه یا رزومه مثال بسیار خوبی از این است که چگونه مدل‌های زبانی بزرگ می‌توانند در افزایش بهره‌وری در فرایند جستجوی شغل مورد استفاده قرار گیرند. با کمک مدل‌های زبانی بزرگ، می‌توانید یک نامه‌ یا رزومه با کیفیت و جذابیت بالا تولید کنید که به شما در میان سایر کاندیداها کمک می‌کند تا برجسته شوید.

تولید کننده متن رزومه می‌تواند به این صورت برنامه‌ریزی شود تا از کاربر سؤال‌هایی در مورد مهارت‌ها، تجربیات و ترجیحات شغلی بپرسد. با توجه به پاسخ‌های ارائه‌شده، مدل زبانی بزرگ، یک رزومه شخصی‌سازی‌شده تولید می‌کند که نقاط قوت و ویژگی‌های کاربر را برای شغل مورد نظر برجسته می‌کند. رزومه تولید شده می‌تواند توسط کاربر ویرایش شود تا اطمینان حاصل شود که نیازهای خاص او را برآورده می‌کند.

امکانات پروژه:

– سوالات قابل تنظیم برای اجازه دادن به کاربران برای ارائه اطلاعات بیشتر درباره خودشان

– حالت پیش‌نمایشی که به کاربران اجازه می‌دهد تا قبل از نهایی کردن، نامه‌ی رزومه‌ی خود را ببینند

– الگوهای پیش‌تعریف شده برای شغل‌ها و صنایع مختلف

– پایگاه داده‌ای از نامه‌های رزومه‌ی موفق برای الهام گرفتن و راهنمایی کاربران

در کل، تولید کننده متن نامه یا رزومه، نمونه خوبی از این است که چگونه مدل‌های زبانی بزرگ می‌توانند فرایند جستجوی شغل را بهبود و بهره‌وری را افزایش دهند.

به عنوان نمونه می تواند از اسکریپت زیر استفاده کند.

prompt_template = """
Write a cover letter to {contact_person}
from {your_name} for a {role} job at {company_name}.
I have experience in {personal_exp}.
I am excited about the job because {job_desc}.
I am passionate about {passion}.
"""

ایده پروژه ۲: چت‌بات سفارشی شده

چت‌بات‌ها یکی از کاربردهای محبوب مدل‌های زبانی بزرگ هستند. با استفاده از چت‌بات‌ها، می‌توانید با کاربران در مورد تمام موضوعاتی که مربوط به کسب‌وکار شما هستند، گفتگو کنید. با اضافه کردن شخصیت به چت‌بات خود، می‌توانید تجربه‌ی کاربری بهتری را فراهم کنید و به صورت فعال با کاربران در ارتباط باشید.

امکانات پروژه:

– طراحی و پیاده‌سازی چت‌بات با استفاده از مدل‌های زبانی بزرگ

– اضافه کردن شخصیت به چت‌بات، مانند یک ربات سخنگو

– شناسایی موضوعات مختلف کسب‌وکار شما و پاسخ به سؤالات کاربران در مورد آن‌ها

– ایجاد پرسشنامه‌های سفارشی برای جمع‌آوری اطلاعات از کاربران

– پیش‌بینی نیازهای کاربران و پیشنهاد راه‌حل‌های مناسب

مزایا:

– بهبود تجربه‌ی کاربری با اضافه کردن شخصیت به چت‌بات

– ارتباط فعال با کاربران و پاسخ به سؤالات آن‌ها

– جمع‌آوری اطلاعات کاربران و پیش‌بینی نیاز‌های آن‌ها

– افزایش رضایت کاربران و افزایش فروش با بهتر شدن ارتباط با مشتریان.

ایده پروژه ۳: خلاصه‌ساز کانال‌های یوتیوب یا پادکست

با توجه به حجم بسیار زیاد محتوای آموزشی و سرگرم‌کننده موجود در کانال‌های یوتیوب و پادکست‌ها، بسیاری از کاربران ممکن است وقت کافی برای تماشای یا گوش دادن به تمام محتواها را نداشته باشند. اینجاست که خلاصه‌ساز کانال‌های یوتیوب یا پادکست به کار می‌آید. این پروژه به شما امکان می‌دهد تا با تولید خلاصه‌ای از محتوای یک کانال یوتیوب یا پادکست به کاربران کمک کنید تا در کمترین زمان ممکن به اطلاعات لازم دسترسی پیدا کنند.

امکانات پروژه:

– پردازش خودکار محتوای کانال یوتیوب یا پادکست با استفاده از مدل‌های زبانی بزرگ

– تولید خلاصه‌ای از محتوای کانال یوتیوب یا پادکست بر اساس موضوعات و مفاهیم کلیدی

– قابلیت تنظیم خلاصه‌های روزانه، هفتگی یا ماهانه برای ارسال به کاربران

– قابلیت سفارشی‌سازی میزان خلاصه بر اساس ترجیحات کاربران

مزایا:

– دسترسی سریع و آسان به اطلاعات لازم

– افزایش بهره‌وری و صرفه‌جویی در زمان

– دسترسی به محتواهای بیشتر با کمترین زمان

– تسهیل فرآیند یادگیری و به‌روزرسانی اطلاعات

– ارائه خدمات به کاربرانی که به دلیل مشکلات شنوایی یا بصری نمی‌توانند محتواهای کامل را مشاهده کنند.

ایده پروژه ۴: استخراج اطلاعات

با توجه به حجم بزرگ از اطلاعات موجود در اینترنت، استخراج اطلاعات از داده‌های مختلف بسیار مهم است. هدف این پروژه، توسعه یک سیستم استخراج اطلاعات خودکار است که بتواند اطلاعات مفید و مورد نیاز را از متن، تصویر یا ویدئو استخراج کند.

امکانات پروژه:

– استخراج اطلاعات از متن با استفاده از تکنیک‌های پردازش زبان طبیعی (NLP)

– استخراج اطلاعات از تصاویر با استفاده از تکنیک‌های پردازش تصویر

– استخراج اطلاعات از ویدئوها با استفاده از تکنیک‌های پردازش ویدئو

– ارائه گزارش‌های جامع از اطلاعات استخراج شده با فرمت‌های مختلف

– قابلیت سفارشی‌سازی و تنظیم پارامترهای مختلف برای بهینه‌سازی کارایی و دقت سیستم

مزایا:

– استخراج اطلاعات به صورت خودکار و سریع

– افزایش دقت و صحت در استخراج اطلاعات

– صرفه‌جویی در زمان و هزینه

– افزایش بهره‌وری با دسترسی سریع و آسان به اطلاعات مورد نیاز

– کاربرد در زمینه‌های مختلف از جمله تحقیقات علمی، بازاریابی و تجارت الکترونیک.

یک مدل از اسکریپت می تواند بصورت زیر باشد:

prompt = """
This program will extract relevant information from a job posting. 
Here are some examples:

Job posting: 
Lead engineer for software integration (remote possible)

At XYZ Co. we are making the world a better place.
To do so we are looking for a lead engineer with experience in Python and JIRA.

Extracted Text:
Role: Lead engieer for software integration.
Company: XYZ Co.
Requirements: Python, JIRA
--
Job posting: 
Senior software engineer - Autonomous Mobility

ABC Inc. is a great company.
We are looking for someone with great ability to write complex C code.

Extracted Text:
"""

ایده پروژه ۵: وب اسکریپر

با توجه به حجم بزرگ از داده‌های موجود در وب، ابزاری برای جمع‌آوری اطلاعات به صورت خودکار بسیار مفید است. هدف این پروژه، توسعه یک وب اسکریپر خودکار است که بتواند اطلاعات مورد نیاز را از صفحات وب جمع‌آوری کند و در فرمت‌های مختلف ذخیره کند.

مراحلی که برای اجرای این پروژه باید دنبال نمایید به این صورت است:

  1. کد منبع وب‌سایت را جمع‌آوری کرده و در یک سند بارگذاری کنید.
  2. اسناد بلند را به بخش‌های کوچکتری تقسیم کنید.
  3. از LLM برای استخراج داده‌های مرتبط از کد منبع استفاده کنید (برای جزئیات بیشتر به بخش استخراج اطلاعات در همین مقاله مراجعه کنید).
  4. با استفاده از مهندسی پرسمان با مثال‌ها، داده‌های استخراج شده را با استفاده از LLM به فرمت مورد نظر تغییر دهید.

امکانات پروژه:

  • جمع‌آوری داده‌ها از صفحات وب با استفاده از تکنیک‌های وب اسکریپینگ
  • انتخاب محتوای مورد نیاز با استفاده از تگ‌های HTML
  • ذخیره داده‌های جمع‌آوری شده در فرمت‌های مختلف از جمله CSV، JSON، XML و…
  • قابلیت برنامه‌ریزی و اجرای جمع‌آوری داده‌ها در بازه‌های زمانی مختلف
  • قابلیت سفارشی‌سازی و تنظیم پارامترهای مختلف برای بهینه‌سازی کارایی و دقت سیستم

مزایا:

  • جمع‌آوری داده‌ها به صورت خودکار و سریع
  • افزایش دقت و صحت در جمع‌آوری داده‌ها
  • صرفه‌جویی در زمان و هزینه
  • دسترسی آسان به داده‌های مورد نیاز
  • کاربرد در زمینه‌های مختلف از جمله تحقیقات علمی، بازاریابی و تجارت الکترونیک.

پروژه‌های مبتنی بر بازنمایی متن

1. پیش‌بینی احساسات متن: در این پروژه، با استفاده از بازنمایی متن و الگوریتم‌های یادگیری ماشین، می‌توانید احساسات متن را پیش‌بینی کنید. این پروژه در زمینه‌هایی مانند تجارت الکترونیک، بازاریابی و تحقیقات علمی کاربرد قابل توجهی دارد.

2. خوشه‌بندی متن: در این پروژه، با استفاده از الگوریتم‌های خوشه‌بندی، می‌توانید متون مشابه را در گروه‌هایی با همان محتوا قرار دهید. این پروژه در زمینه‌هایی مانند مدیریت محتوا و جستجوی اطلاعات کاربرد دارد.

3. تشخیص موضوع متن: در این پروژه، می‌توانید با استفاده از بازنمایی متن، موضوعات مختلف متون را تشخیص دهید. این پروژه در زمینه‌هایی مانند جستجوی دقیق و دسته‌بندی موضوعات مختلف کاربرد دارد.

4. تشخیص اسناد تقلبی: در این پروژه، با استفاده از بازنمایی متن و الگوریتم‌های یادگیری ماشین، می‌توانید اسناد تقلبی را تشخیص داده و جلوی تقلب را بگیرید. این پروژه در زمینه‌هایی مانند آموزش و پژوهش کاربرد دارد.

5. تشخیص اصطلاحات و عبارت‌های رایج: در این پروژه، می‌توانید با استفاده از بازنمایی متن و الگوریتم‌های پردازش زبان طبیعی، اصطلاحات و عبارت‌های رایج در متون را تشخیص دهید. این پروژه در زمینه‌هایی مانند یادگیری زبان، تحقیقات علمی و تجارت الکترونیک کاربرد دارد.

ایده پروژه ۶: پایگاه داده قابل جستجوی اسناد

این پروژه به شما اجازه می‌دهد تا یک پایگاه داده قابل جستجوی از سند‌های خود ایجاد کنید. با این پروژه، می‌توانید به راحتی به سند‌های خود دسترسی داشته باشید و آن‌ها را به سادگی جستجو کنید.

اینجا مراحل تخمینی هستند که برای اجرای چنین پروژه ای باید دنبال نمایید:

– فایل‌ها را به صورت سند بارگذاری کنید.

– اسناد بلند را به بخش‌های کوچکتری تقسیم کنید.

– با استفاده از یک مدل بازنمایی، مانند مدل Word2Vec یا GloVe، بازنمایی از سند‌ها بسازید و آن‌ها را در حافظه ذخیره کنید.

– پرسمان مورد نظری را که برای بازیابی فایل‌های مرتبط استفاده خواهید کرد، تعریف کنید. به عنوان مثال، می‌توانید از الگوریتم جستجوی مبتنی بر محتوا (مانند TF-IDF) یا الگوریتم جستجوی مبتنی بر شباهت بازنمایی (مانند cosine similarity) استفاده کنید.

امکانات پروژه:

– ایجاد پایگاه داده از سند‌های شما با فرمت‌های مختلف از جمله PDF، Word، Excel و…

– ایجاد پیش‌نمایشی از هر سند شامل عنوان، توضیحات و تصویر پیش‌نمایش

– قابلیت جستجوی متنی در سند‌ها و نمایش نتایج با دقت بالا

– دسته‌بندی سند‌ها بر اساس موضوع یا دسته‌بندی دلخواه شما

– قابلیت بارگذاری یا حذف سند‌های جدید به پایگاه داده

– قابلیت اشتراک گذاری سند‌ها با دیگران

مزایا:

– دسترسی آسان و سریع به سند‌های شما

– قابلیت جستجوی دقیق در متن سند‌ها با دقت بالا

– کاهش زمان و هزینه در جستجوی سند‌ها

– دسته‌بندی و سازماندهی بهتر سند‌ها

– امکان اشتراک گذاری سند‌ها با دیگران در سراسر شبکه

ایده پروژه ۷: پاسخگویی به سوالات از روی سند‌ها

این پروژه به شما اجازه می‌دهد تا یک سیستم پاسخگویی به سوالات را بر روی سند‌های خود ایجاد کنید. با استفاده از این پروژه، کاربران می‌توانند با وارد کردن سوالات، به راحتی پاسخ مناسب خود را در سند‌های خود پیدا کنند.

مراحل تخمینی برای اجرای چنین پروژه ای عبارتند از:

  1. بارگذاری کد منبع به صورت سند.
  2. اسناد بلند را به بخش‌های کوچکتری تقسیم کنید.
  3. با استفاده از یک مدل بازنمایی، مانند مدل Word2Vec یا GloVe، بازنمایی از سند‌ها بسازید و آن‌ها را در حافظه ذخیره کنید.
  4. تعریف یک پرسش از کاربر با استفاده از مدل پردازش زبان طبیعی (NLP) مانند BERT یا GPT.
  5. استفاده از مدل پردازش زبان طبیعی برای پاسخ به سوالات کاربر با استفاده از بازنمایی سند‌ها و مدل پرسش/پاسخ آموزش دیده شده.
  6. نمایش پاسخ به کاربر.

امکانات پروژه:

– ایجاد پایگاه داده از سند‌های شما با فرمت‌های مختلف از جمله PDF، Word، Excel و…

– پردازش زبان طبیعی (NLP) برای استخراج اطلاعات از سند‌ها

– پرسش و پاسخ مبتنی بر محتوای سند‌ها

– نمایش پاسخ به صورت متنی یا گرافیکی (مثلاً نمودار‌ها و نمایش داده‌های جدولی)

– قابلیت تعریف سوالات چندگزینه‌ای

– قابلیت برچسب‌گذاری داده‌ها برای بهبود دقت پاسخگویی

– قابلیت بارگذاری یا حذف سند‌های جدید به پایگاه داده

مزایا:

– دسترسی آسان و سریع به پاسخ‌های مرتبط با سوالات

– کاهش زمان و هزینه در جستجوی پاسخ به سوالات

– قابلیت پاسخگویی به سوالات تخصصی

– دسته‌بندی و سازماندهی بهتر سند‌ها

– امکان اشتراک گذاری پاسخ‌های به دست آمده با دیگران در سراسر شبکه

ایده پروژه ۸: خوشه‌بندی (دسته بندی) سند‌ها با عناوین مختلف

این پروژه به شما اجازه می‌دهد تا سند‌های خود را بر اساس موضوعات مشابه به گروه‌هایی تقسیم کنید. با استفاده از این پروژه، می‌توانید به راحتی به سند‌های خود دسترسی داشته باشید و آن‌ها را به موضوعات مشابه دسته‌بندی کنید.

در ادامه میتوانید مراحل تخمینی برای اجرای چنین پروژه ای را ببینید:

  1. بارگذاری محتوا به صورت سند.
  2. اسناد بلند را به بخش‌های کوچکتری تقسیم کنید.
  3. با استفاده از یک مدل بازنمایی، مانند مدل Word2Vec یا GloVe، بازنمایی از سند‌ها بسازید و آن‌ها را در حافظه ذخیره کنید.
  4. استفاده از الگوریتم‌های خوشه‌بندی مانند k-means، DBSCAN و hierarchical clustering برای گروه‌بندی سند‌ها به موضوعات مشابه با استفاده از بازنمایی سند‌ها.
  5. ارزیابی عملکرد الگوریتم خوشه‌بندی با استفاده از معیارهایی مانند دقت، صحت و اندازه خوشه‌ها.
  6. نمایش خوشه‌ها به صورت گرافیکی.

امکانات پروژه:

– ایجاد پایگاه داده از سند‌های شما با فرمت‌های مختلف از جمله PDF، Word، Excel و…

– استفاده از الگوریتم‌های خوشه‌بندی مانند k-means ،DBSCAN و hierarchical clustering برای گروه‌بندی سند‌ها به موضوعات مشابه

– نمایش خوشه‌ها به صورت گرافیکی با استفاده از نمودارهای دایره‌ای (pie charts)، نمودارهای میله‌ای (bar charts) و نمودارهای شبکه‌ای (network graphs)

– قابلیت جستجوی موضوعات و دسته‌بندی سند‌ها بر اساس موضوع

– قابلیت بارگذاری یا حذف سند‌های جدید به پایگاه داده

مزایا:

– دسترسی آسان و سریع به سند‌های مشابه به هم

– دسته‌بندی و سازماندهی بهتر سند‌ها

– کاهش زمان و هزینه در جستجوی سند‌های مرتبط با یک موضوع خاص

– قابلیت بررسی موضوعاتی که بیشترین سند‌ها را شامل می‌شوند

– امکان اشتراک گذاری سند‌های مشابه با دیگران در سراسر شبکه.

ایده پروژه ۹: طبقه‌بندی درخواست‌ها

این پروژه به شما اجازه می‌دهد تا درخواست‌های خود را بر اساس نوعشان دسته‌بندی کنید. با استفاده از این پروژه، می‌توانید به راحتی به درخواست‌های خود دسترسی داشته باشید و آن‌ها را به دسته‌های مشابه دسته‌بندی کنید.

امکانات پروژه:

– ایجاد پایگاه داده از درخواست‌های شما با فرمت‌های مختلف از جمله متن، ایمیل و …

– استفاده از مدل‌های شبکه عصبی مانند LSTM و CNN برای طبقه‌بندی درخواست‌ها

– نمایش برچسب‌هایی که به هر درخواست اختصاص داده شده است

– قابلیت جستجوی درخواست‌ها و دسته‌بندی آن‌ها بر اساس نوع درخواست

– قابلیت بارگذاری یا حذف درخواست‌های جدید به پایگاه داده

مزایا:

– دسترسی آسان و سریع به درخواست‌های مشابه به هم

– دسته‌بندی و سازماندهی بهتر درخواست‌ها

– کاهش زمان و هزینه در جستجوی درخواست‌های مرتبط با یک نوع خاص

– قابلیت بررسی نوع درخواست‌هایی که بیشترین میزان درخواست را شامل می‌شوند

– امکان اشتراک گذاری درخواست‌های مشابه با دیگران در سراسر شبکه.

دکتر مصطفی جهانگشای رضائی

استاد گروه مهندسی صنایع دانشگاه صنعتی | هوش مصنوعی در کسب و کار

Leave a Reply

Close Menu