با ظهور مدلهای زبانی بزرگ یا (Large Language Models (LLMs به شکل مدلهای پایه پیشآموزشداده شده، مانند GPT-3 از OpenAI، فرصتهای بینهایتی برای پیاده سازی ایده های جالب پروژه با استفاده از این مدلها وجود دارد. و با ظهور ابزارهای توسعه دهندگان، مانع فنی کمتر شده است.
در ادامه ۹ ایده جذاب که از مدلهای زبانی بزرگ برای وظایف پاییندست استفاده میکنند، معرفی می کنیم:
- نوشتن خودکار متن نامه
- چتبات با شخصیت مجازی
- خلاصهکننده ویدیوهای یوتیوب
- استخراج اطلاعات از آگهیهای استخدامی
- وب اسکریپر سفارشی
- پایگاه دادهی قابل جستجوی اسناد
- پاسخ به سوالات با استفاده از متن سند
- دستهبندی پستهای شبکههای اجتماعی و قسمتهای مختلف پادکست
- دستهبندی درخواستهای کسب و کار از طریق ایمیل
پروژههای مبتنی بر تولید متن
مدل های زبانی بزرگ(LLMs) یا ابر مدل های زبانی بیشتر به دلیل قابلیتهای تولیدی خود مشهور هستند. در این بخش، ابتدا چند ایده پروژه مبتنی بر موارد کاربردی مربوط به آنها را بررسی خواهیم کرد:
- ایجاد کننده: تولید متن نامه
- محاوره ای: چتبات با شخصیت مجازی
- خلاصهسازی: خلاصهکننده ویدیوهای یوتیوب
- استخراج: استخراج اطلاعات از آگهیهای استخدامی
- بازنویسی: وب اسکریپر سفارشی
ایده پروژه ۱: تولید متن نامه (مثلا نامه درخواست)
تولید متن نامه یا رزومه مثال بسیار خوبی از این است که چگونه مدلهای زبانی بزرگ میتوانند در افزایش بهرهوری در فرایند جستجوی شغل مورد استفاده قرار گیرند. با کمک مدلهای زبانی بزرگ، میتوانید یک نامه یا رزومه با کیفیت و جذابیت بالا تولید کنید که به شما در میان سایر کاندیداها کمک میکند تا برجسته شوید.
تولید کننده متن رزومه میتواند به این صورت برنامهریزی شود تا از کاربر سؤالهایی در مورد مهارتها، تجربیات و ترجیحات شغلی بپرسد. با توجه به پاسخهای ارائهشده، مدل زبانی بزرگ، یک رزومه شخصیسازیشده تولید میکند که نقاط قوت و ویژگیهای کاربر را برای شغل مورد نظر برجسته میکند. رزومه تولید شده میتواند توسط کاربر ویرایش شود تا اطمینان حاصل شود که نیازهای خاص او را برآورده میکند.
امکانات پروژه:
– سوالات قابل تنظیم برای اجازه دادن به کاربران برای ارائه اطلاعات بیشتر درباره خودشان
– حالت پیشنمایشی که به کاربران اجازه میدهد تا قبل از نهایی کردن، نامهی رزومهی خود را ببینند
– الگوهای پیشتعریف شده برای شغلها و صنایع مختلف
– پایگاه دادهای از نامههای رزومهی موفق برای الهام گرفتن و راهنمایی کاربران
در کل، تولید کننده متن نامه یا رزومه، نمونه خوبی از این است که چگونه مدلهای زبانی بزرگ میتوانند فرایند جستجوی شغل را بهبود و بهرهوری را افزایش دهند.
به عنوان نمونه می تواند از اسکریپت زیر استفاده کند.
prompt_template = """ Write a cover letter to {contact_person} from {your_name} for a {role} job at {company_name}. I have experience in {personal_exp}. I am excited about the job because {job_desc}. I am passionate about {passion}. """
ایده پروژه ۲: چتبات سفارشی شده
چتباتها یکی از کاربردهای محبوب مدلهای زبانی بزرگ هستند. با استفاده از چتباتها، میتوانید با کاربران در مورد تمام موضوعاتی که مربوط به کسبوکار شما هستند، گفتگو کنید. با اضافه کردن شخصیت به چتبات خود، میتوانید تجربهی کاربری بهتری را فراهم کنید و به صورت فعال با کاربران در ارتباط باشید.
امکانات پروژه:
– طراحی و پیادهسازی چتبات با استفاده از مدلهای زبانی بزرگ
– اضافه کردن شخصیت به چتبات، مانند یک ربات سخنگو
– شناسایی موضوعات مختلف کسبوکار شما و پاسخ به سؤالات کاربران در مورد آنها
– ایجاد پرسشنامههای سفارشی برای جمعآوری اطلاعات از کاربران
– پیشبینی نیازهای کاربران و پیشنهاد راهحلهای مناسب
مزایا:
– بهبود تجربهی کاربری با اضافه کردن شخصیت به چتبات
– ارتباط فعال با کاربران و پاسخ به سؤالات آنها
– جمعآوری اطلاعات کاربران و پیشبینی نیازهای آنها
– افزایش رضایت کاربران و افزایش فروش با بهتر شدن ارتباط با مشتریان.
ایده پروژه ۳: خلاصهساز کانالهای یوتیوب یا پادکست
با توجه به حجم بسیار زیاد محتوای آموزشی و سرگرمکننده موجود در کانالهای یوتیوب و پادکستها، بسیاری از کاربران ممکن است وقت کافی برای تماشای یا گوش دادن به تمام محتواها را نداشته باشند. اینجاست که خلاصهساز کانالهای یوتیوب یا پادکست به کار میآید. این پروژه به شما امکان میدهد تا با تولید خلاصهای از محتوای یک کانال یوتیوب یا پادکست به کاربران کمک کنید تا در کمترین زمان ممکن به اطلاعات لازم دسترسی پیدا کنند.
امکانات پروژه:
– پردازش خودکار محتوای کانال یوتیوب یا پادکست با استفاده از مدلهای زبانی بزرگ
– تولید خلاصهای از محتوای کانال یوتیوب یا پادکست بر اساس موضوعات و مفاهیم کلیدی
– قابلیت تنظیم خلاصههای روزانه، هفتگی یا ماهانه برای ارسال به کاربران
– قابلیت سفارشیسازی میزان خلاصه بر اساس ترجیحات کاربران
مزایا:
– دسترسی سریع و آسان به اطلاعات لازم
– افزایش بهرهوری و صرفهجویی در زمان
– دسترسی به محتواهای بیشتر با کمترین زمان
– تسهیل فرآیند یادگیری و بهروزرسانی اطلاعات
– ارائه خدمات به کاربرانی که به دلیل مشکلات شنوایی یا بصری نمیتوانند محتواهای کامل را مشاهده کنند.
ایده پروژه ۴: استخراج اطلاعات
با توجه به حجم بزرگ از اطلاعات موجود در اینترنت، استخراج اطلاعات از دادههای مختلف بسیار مهم است. هدف این پروژه، توسعه یک سیستم استخراج اطلاعات خودکار است که بتواند اطلاعات مفید و مورد نیاز را از متن، تصویر یا ویدئو استخراج کند.
امکانات پروژه:
– استخراج اطلاعات از متن با استفاده از تکنیکهای پردازش زبان طبیعی (NLP)
– استخراج اطلاعات از تصاویر با استفاده از تکنیکهای پردازش تصویر
– استخراج اطلاعات از ویدئوها با استفاده از تکنیکهای پردازش ویدئو
– ارائه گزارشهای جامع از اطلاعات استخراج شده با فرمتهای مختلف
– قابلیت سفارشیسازی و تنظیم پارامترهای مختلف برای بهینهسازی کارایی و دقت سیستم
مزایا:
– استخراج اطلاعات به صورت خودکار و سریع
– افزایش دقت و صحت در استخراج اطلاعات
– صرفهجویی در زمان و هزینه
– افزایش بهرهوری با دسترسی سریع و آسان به اطلاعات مورد نیاز
– کاربرد در زمینههای مختلف از جمله تحقیقات علمی، بازاریابی و تجارت الکترونیک.
یک مدل از اسکریپت می تواند بصورت زیر باشد:
prompt = """ This program will extract relevant information from a job posting. Here are some examples: Job posting: Lead engineer for software integration (remote possible) At XYZ Co. we are making the world a better place. To do so we are looking for a lead engineer with experience in Python and JIRA. Extracted Text: Role: Lead engieer for software integration. Company: XYZ Co. Requirements: Python, JIRA -- Job posting: Senior software engineer - Autonomous Mobility ABC Inc. is a great company. We are looking for someone with great ability to write complex C code. Extracted Text: """
ایده پروژه ۵: وب اسکریپر
با توجه به حجم بزرگ از دادههای موجود در وب، ابزاری برای جمعآوری اطلاعات به صورت خودکار بسیار مفید است. هدف این پروژه، توسعه یک وب اسکریپر خودکار است که بتواند اطلاعات مورد نیاز را از صفحات وب جمعآوری کند و در فرمتهای مختلف ذخیره کند.
مراحلی که برای اجرای این پروژه باید دنبال نمایید به این صورت است:
- کد منبع وبسایت را جمعآوری کرده و در یک سند بارگذاری کنید.
- اسناد بلند را به بخشهای کوچکتری تقسیم کنید.
- از LLM برای استخراج دادههای مرتبط از کد منبع استفاده کنید (برای جزئیات بیشتر به بخش استخراج اطلاعات در همین مقاله مراجعه کنید).
- با استفاده از مهندسی پرسمان با مثالها، دادههای استخراج شده را با استفاده از LLM به فرمت مورد نظر تغییر دهید.
امکانات پروژه:
- جمعآوری دادهها از صفحات وب با استفاده از تکنیکهای وب اسکریپینگ
- انتخاب محتوای مورد نیاز با استفاده از تگهای HTML
- ذخیره دادههای جمعآوری شده در فرمتهای مختلف از جمله CSV، JSON، XML و…
- قابلیت برنامهریزی و اجرای جمعآوری دادهها در بازههای زمانی مختلف
- قابلیت سفارشیسازی و تنظیم پارامترهای مختلف برای بهینهسازی کارایی و دقت سیستم
مزایا:
- جمعآوری دادهها به صورت خودکار و سریع
- افزایش دقت و صحت در جمعآوری دادهها
- صرفهجویی در زمان و هزینه
- دسترسی آسان به دادههای مورد نیاز
- کاربرد در زمینههای مختلف از جمله تحقیقات علمی، بازاریابی و تجارت الکترونیک.
پروژههای مبتنی بر بازنمایی متن
1. پیشبینی احساسات متن: در این پروژه، با استفاده از بازنمایی متن و الگوریتمهای یادگیری ماشین، میتوانید احساسات متن را پیشبینی کنید. این پروژه در زمینههایی مانند تجارت الکترونیک، بازاریابی و تحقیقات علمی کاربرد قابل توجهی دارد.
2. خوشهبندی متن: در این پروژه، با استفاده از الگوریتمهای خوشهبندی، میتوانید متون مشابه را در گروههایی با همان محتوا قرار دهید. این پروژه در زمینههایی مانند مدیریت محتوا و جستجوی اطلاعات کاربرد دارد.
3. تشخیص موضوع متن: در این پروژه، میتوانید با استفاده از بازنمایی متن، موضوعات مختلف متون را تشخیص دهید. این پروژه در زمینههایی مانند جستجوی دقیق و دستهبندی موضوعات مختلف کاربرد دارد.
4. تشخیص اسناد تقلبی: در این پروژه، با استفاده از بازنمایی متن و الگوریتمهای یادگیری ماشین، میتوانید اسناد تقلبی را تشخیص داده و جلوی تقلب را بگیرید. این پروژه در زمینههایی مانند آموزش و پژوهش کاربرد دارد.
5. تشخیص اصطلاحات و عبارتهای رایج: در این پروژه، میتوانید با استفاده از بازنمایی متن و الگوریتمهای پردازش زبان طبیعی، اصطلاحات و عبارتهای رایج در متون را تشخیص دهید. این پروژه در زمینههایی مانند یادگیری زبان، تحقیقات علمی و تجارت الکترونیک کاربرد دارد.
ایده پروژه ۶: پایگاه داده قابل جستجوی اسناد
این پروژه به شما اجازه میدهد تا یک پایگاه داده قابل جستجوی از سندهای خود ایجاد کنید. با این پروژه، میتوانید به راحتی به سندهای خود دسترسی داشته باشید و آنها را به سادگی جستجو کنید.
اینجا مراحل تخمینی هستند که برای اجرای چنین پروژه ای باید دنبال نمایید:
– فایلها را به صورت سند بارگذاری کنید.
– اسناد بلند را به بخشهای کوچکتری تقسیم کنید.
– با استفاده از یک مدل بازنمایی، مانند مدل Word2Vec یا GloVe، بازنمایی از سندها بسازید و آنها را در حافظه ذخیره کنید.
– پرسمان مورد نظری را که برای بازیابی فایلهای مرتبط استفاده خواهید کرد، تعریف کنید. به عنوان مثال، میتوانید از الگوریتم جستجوی مبتنی بر محتوا (مانند TF-IDF) یا الگوریتم جستجوی مبتنی بر شباهت بازنمایی (مانند cosine similarity) استفاده کنید.
امکانات پروژه:
– ایجاد پایگاه داده از سندهای شما با فرمتهای مختلف از جمله PDF، Word، Excel و…
– ایجاد پیشنمایشی از هر سند شامل عنوان، توضیحات و تصویر پیشنمایش
– قابلیت جستجوی متنی در سندها و نمایش نتایج با دقت بالا
– دستهبندی سندها بر اساس موضوع یا دستهبندی دلخواه شما
– قابلیت بارگذاری یا حذف سندهای جدید به پایگاه داده
– قابلیت اشتراک گذاری سندها با دیگران
مزایا:
– دسترسی آسان و سریع به سندهای شما
– قابلیت جستجوی دقیق در متن سندها با دقت بالا
– کاهش زمان و هزینه در جستجوی سندها
– دستهبندی و سازماندهی بهتر سندها
– امکان اشتراک گذاری سندها با دیگران در سراسر شبکه
ایده پروژه ۷: پاسخگویی به سوالات از روی سندها
این پروژه به شما اجازه میدهد تا یک سیستم پاسخگویی به سوالات را بر روی سندهای خود ایجاد کنید. با استفاده از این پروژه، کاربران میتوانند با وارد کردن سوالات، به راحتی پاسخ مناسب خود را در سندهای خود پیدا کنند.
مراحل تخمینی برای اجرای چنین پروژه ای عبارتند از:
- بارگذاری کد منبع به صورت سند.
- اسناد بلند را به بخشهای کوچکتری تقسیم کنید.
- با استفاده از یک مدل بازنمایی، مانند مدل Word2Vec یا GloVe، بازنمایی از سندها بسازید و آنها را در حافظه ذخیره کنید.
- تعریف یک پرسش از کاربر با استفاده از مدل پردازش زبان طبیعی (NLP) مانند BERT یا GPT.
- استفاده از مدل پردازش زبان طبیعی برای پاسخ به سوالات کاربر با استفاده از بازنمایی سندها و مدل پرسش/پاسخ آموزش دیده شده.
- نمایش پاسخ به کاربر.
امکانات پروژه:
– ایجاد پایگاه داده از سندهای شما با فرمتهای مختلف از جمله PDF، Word، Excel و…
– پردازش زبان طبیعی (NLP) برای استخراج اطلاعات از سندها
– پرسش و پاسخ مبتنی بر محتوای سندها
– نمایش پاسخ به صورت متنی یا گرافیکی (مثلاً نمودارها و نمایش دادههای جدولی)
– قابلیت تعریف سوالات چندگزینهای
– قابلیت برچسبگذاری دادهها برای بهبود دقت پاسخگویی
– قابلیت بارگذاری یا حذف سندهای جدید به پایگاه داده
مزایا:
– دسترسی آسان و سریع به پاسخهای مرتبط با سوالات
– کاهش زمان و هزینه در جستجوی پاسخ به سوالات
– قابلیت پاسخگویی به سوالات تخصصی
– دستهبندی و سازماندهی بهتر سندها
– امکان اشتراک گذاری پاسخهای به دست آمده با دیگران در سراسر شبکه
ایده پروژه ۸: خوشهبندی (دسته بندی) سندها با عناوین مختلف
این پروژه به شما اجازه میدهد تا سندهای خود را بر اساس موضوعات مشابه به گروههایی تقسیم کنید. با استفاده از این پروژه، میتوانید به راحتی به سندهای خود دسترسی داشته باشید و آنها را به موضوعات مشابه دستهبندی کنید.
در ادامه میتوانید مراحل تخمینی برای اجرای چنین پروژه ای را ببینید:
- بارگذاری محتوا به صورت سند.
- اسناد بلند را به بخشهای کوچکتری تقسیم کنید.
- با استفاده از یک مدل بازنمایی، مانند مدل Word2Vec یا GloVe، بازنمایی از سندها بسازید و آنها را در حافظه ذخیره کنید.
- استفاده از الگوریتمهای خوشهبندی مانند k-means، DBSCAN و hierarchical clustering برای گروهبندی سندها به موضوعات مشابه با استفاده از بازنمایی سندها.
- ارزیابی عملکرد الگوریتم خوشهبندی با استفاده از معیارهایی مانند دقت، صحت و اندازه خوشهها.
- نمایش خوشهها به صورت گرافیکی.
امکانات پروژه:
– ایجاد پایگاه داده از سندهای شما با فرمتهای مختلف از جمله PDF، Word، Excel و…
– استفاده از الگوریتمهای خوشهبندی مانند k-means ،DBSCAN و hierarchical clustering برای گروهبندی سندها به موضوعات مشابه
– نمایش خوشهها به صورت گرافیکی با استفاده از نمودارهای دایرهای (pie charts)، نمودارهای میلهای (bar charts) و نمودارهای شبکهای (network graphs)
– قابلیت جستجوی موضوعات و دستهبندی سندها بر اساس موضوع
– قابلیت بارگذاری یا حذف سندهای جدید به پایگاه داده
مزایا:
– دسترسی آسان و سریع به سندهای مشابه به هم
– دستهبندی و سازماندهی بهتر سندها
– کاهش زمان و هزینه در جستجوی سندهای مرتبط با یک موضوع خاص
– قابلیت بررسی موضوعاتی که بیشترین سندها را شامل میشوند
– امکان اشتراک گذاری سندهای مشابه با دیگران در سراسر شبکه.
ایده پروژه ۹: طبقهبندی درخواستها
این پروژه به شما اجازه میدهد تا درخواستهای خود را بر اساس نوعشان دستهبندی کنید. با استفاده از این پروژه، میتوانید به راحتی به درخواستهای خود دسترسی داشته باشید و آنها را به دستههای مشابه دستهبندی کنید.
امکانات پروژه:
– ایجاد پایگاه داده از درخواستهای شما با فرمتهای مختلف از جمله متن، ایمیل و …
– استفاده از مدلهای شبکه عصبی مانند LSTM و CNN برای طبقهبندی درخواستها
– نمایش برچسبهایی که به هر درخواست اختصاص داده شده است
– قابلیت جستجوی درخواستها و دستهبندی آنها بر اساس نوع درخواست
– قابلیت بارگذاری یا حذف درخواستهای جدید به پایگاه داده
مزایا:
– دسترسی آسان و سریع به درخواستهای مشابه به هم
– دستهبندی و سازماندهی بهتر درخواستها
– کاهش زمان و هزینه در جستجوی درخواستهای مرتبط با یک نوع خاص
– قابلیت بررسی نوع درخواستهایی که بیشترین میزان درخواست را شامل میشوند
– امکان اشتراک گذاری درخواستهای مشابه با دیگران در سراسر شبکه.
دکتر مصطفی جهانگشای رضائی
استاد گروه مهندسی صنایع دانشگاه صنعتی | هوش مصنوعی در کسب و کار