البته این افزایش کمیت زبان فارسی به شرطی قابل قبول است که به رشد این زبان منجر شود و کیفیت محتوا نیز رو به افزایش باشد. بر اساس آمار ارائه شده در سال 1395، از بین چهار میلیارد صفحه فارسی شناسایی شده توسط موتور جستجوی پارسیجو، نزدیک به 25 درصد آنها ارزشمند و مابقی صفحات تکراری یا اسپم بوده اند که نشان از کیفیت پایین محتوا دارد. اما آمار دقیقی از وضعیت جدید کیفیت محتوا در دسترس نیست. اما برخی از شاخص ها مانند افزایش چشمگیر محتوای کتاب های دیجیتال فارسی نشان از رشد محتوای ارزشمند در این زمینه دارد. با این حال، تناسب رشد در کیفیت و کمیت محتوای فارسی مستلزم تحقیقات گسترده تری است.
چالش های شناسایی شده در این بخش عبارتند از:
چالش های بخش عرضه
در زمینه تقاضا اعتماد چندانی به تولیدات داخلی وجود ندارد و اکثر مشتریان ترجیح می دهند از محصولات آماده خارجی استفاده کنند. می توان گفت دلیل اصلی در این زمینه نبود مرجع مشخص برای ارزیابی و استانداردسازی محصولات، ابزار و خدمات این حوزه است.
تنظیم خط شکسته در فضای مجازی
دو رسانه «سخن» و «خط» رسانه هایی هستند که عمر طولانی دارند و از دیرباز با انسان ها بوده اند. اما در حال حاضر این دو رسانه در دسترس هستند.
بر اساس آمار W3TeECH در سال 2019 برای اولین بار در تاریخ، زبان فارسی به عنوان یکی از 5 زبان اول پرکاربرد وب، با رشد ویژه ای همراه شد و به سهم 3.8 درصدی وب رسید، اما این وضعیت در نیمه دوم سال 2020 کاهش یافت. او متوجه شد که دلیل این امر را می توان به سرعت نسبتاً بالاتر تولید محتوا در سایر زبان ها در دوره کرونا نسبت داد که باعث شد این تعداد به زیر سه درصد برسد. خوشبختانه پس از افت ناگهانی، طی نیمه اول سال 2021، زبان فارسی روند صعودی خود را از سر گرفت و با سهم 3.4 درصدی همچنان پنجمین زبان وب است.
فضای مجازی از نظر فنی و کاربری دارای قابلیت ها و محدودیت هایی است که بر شرایط و الزامات خاصی بر نوشتار و زبان حاکم است. برای پاسخگویی به موقع و موثر به نیازهای خط و زبان در فضای مجازی و تجهیز خط و زبان، نظارت مستمر و تحلیلی و ارائه راهکارهای علمی و فنی برای مسائل ضروری است.
هزینه تامین برخی زیرساخت ها در این حوزه وابسته به نرخ ارز است و در نتیجه قیمت تمام شده ریالی محصولات نهایی یکی از مشکلات تامین کنندگان به دلیل نوسانات ارزی است.
یکی از موضوعات مهم برای رشد و توسعه زبان فارسی و بسیاری از فناوری های دیگر مانند کلان دیتا و اینترنت اشیا در کشور، توسعه خط پردازش و زبان فارسی است. شناخت علایق، تفکر و پیش بینی الگوهای جامعه مستلزم پردازش محتوای تولید شده توسط کاربران در فضای مجازی است. یکی از گرایش های جدی در زمینه تولید محتوا در آینده نزدیک استفاده از ماشین ها و ربات ها برای تولید محتوا است که نیازمند پردازش ماشینی دست خط و زبان است. همچنین، افکار و نگرشها اخیراً از طریق دستکاری ماشینی نظرات و پستها مهندسی شدهاند.
همچنین برای توسعه خط و زبان فارسی در فضای مجازی، ایجاد پیوندهای راهبردی و همکاری های بین المللی به ویژه با کشورهای فارسی زبان و استفاده از ظرفیت های بین المللی در این راستا ضروری است.
اما در مورد خط فارسی فضای مجازی آسیب هایی مانند شکسته نویسی، غلط املایی و تلخیص بی قاعده وارد شده است. که برمی گردد به ماهیت و الزامات فضای مجازی که افزایش سرعت نوشتن است. برای اصلاح این روند و کاهش آسیب های آن، باید راهکارهای زیر به طور همزمان و با اراده کافی در دستگاه های سیاست گذاری و حاکمیتی در حوزه زبان و خوشنویسی فارسی اعم از فرهنگستان زبان و ادب فارسی و فرهنگستان زبان و ادب فارسی دنبال شود. مرکز ملی فضای مجازی
* کارشناس مرکز ملی فضای مجازی
تیم تحرریه شبکه خبری فناوری اطلاعات و ارتباطات
جداسازی فرمت نوشتاری مجازی و غیر مجازی
فضای مجازی یک فرصت است چرا که حوزه نفوذ زبانی را افزایش میدهد، آموزش زبان را آسان میکند و دسترسی به محتوای علمی، فرهنگی و خبری را تسهیل میکند و محتوای فارسی را در فضای مجازی پخش میکند و کسبوکارهای جدید ایجاد میکند. ; اما مشکل از زمانی شروع می شود که مطالب ناسالمی در حوزه خوشنویسی، زبان و فرهنگ در فضای مجازی منتشر می شود. زیرا محتوای اصیل و ارزشمند است که زبان را غنی می کند و کاهش کیفیت آن آسیب جدی به زبان وارد می کند.
چالش های بخش فناوری
در حال حاضر نوع استاندارد زبان فارسی با نوع فضای مجازی آن متفاوت است و اگر نوع فضای مجازی زبان و رسم الخط فارسی شناخته و استاندارد شود و هر کدام از این انواع در جای خود استفاده شود مشکلی پیش نمی آید. اما اگر گوینده آنقدر در یک زبان خاص غوطه ور شود که با ورود به زبان جدید نتواند خود را تطبیق دهد، باعث آسیب به دست خط و زبان می شود.
توسعه ابزارهای پردازش برای تسهیل کار کاربران
در حال حاضر محصولات با کیفیت رایگان و خارجی در بازار وجود دارد که مشتریان تمایل بیشتری به استفاده از آنها دارند.
بهره گیری از فرصت های فضای مجازی و جلوگیری از تهدیدات آن برای خط و زبان فارسی عزم ملی می طلبد. بنابراین لازم است زمینه ایجاد و تحقق نهضت ملی پاسداری و ترویج خط و زبان فارسی در فضای مجازی فراهم شود. (1) احیای آگاهی عمومی و ارتقاء خودباوری و غیرت ملی نسبت به جایگاه و ارزش خط و زبان فارسی در تبیین و حفظ معارف والای بشری، (2) فعال سازی دینی، فکری، علمی، فرهنگی، هنری و سیاسی. خواص و تأثیرگذاران در انتشار گفتمان حفاظت از خط و زبان فارسی به عنوان سرمایه ملی بی بدیل و همچنین (3) جریان اجتماعی در بسترهای مختلف فضای مجازی برای حفاظت از خط و زبان استاندارد از جمله اقدامات اساسی مورد نیاز برای تحقق نهضت ملی
طبق آمار منتشر شده در W3TeCH رشد زبان فارسی بیشتر از زبان هایی مانند عربی و انگلیسی بوده است. اما در میان زبان های غرب آسیا، زبان ترکی بیش از زبان فارسی رشد کرده است. به طوری که در سال 2018 زبان فارسی بالاترین رتبه را در غرب آسیا داشته است. اما اکنون زبان ترکی در این زمینه پیشی گرفته و به سومین زبان وب سایت ها در جهان تبدیل شده است.
با توجه به الزامات نوشتن در فضای مجازی، از جمله آنها می توان به سرعت بالا در این فضا اشاره کرد. اگر خط شکسته توسط نهادی مانند فرهنگستان زبان و ادبیات فارسی تنظیم شود، می تواند به ساماندهی خط و زبان در این زمینه کمک کند. نمونه ای از این کار در کشورهای پیشرفته و بر روی زبان هایی مانند انگلیسی انجام شده است.
اندازه بازار محصولات پردازش زبان طبیعی در سال 2020 به 10.7 میلیارد دلار رسید و انتظار می رود تا سال 2026 با CAGR 26.84 درصد به 48.46 میلیارد دلار برسد. با وجود این بازار بزرگ جهانی، رقم این بازار در داخل کشور بسیار ناچیز است. تعداد کمی از شرکت ها در این زمینه فعال هستند و کیفیت خدمات نیز چندان بالا نیست. در بسیاری از زمینه ها، بازار تحت سلطه رقبای خارجی مانند گوگل و مایکروسافت است. چالش های مطرح شده در حوزه نگارش و پردازش زبان فارسی در سه سطح عرضه، تقاضا و فناوری ارائه شده است.
پردازش خط و زبان فارسی
راه حل های پیشنهادی
ابزارهای پردازشی مانند ابزارهای ویرایش خودکار یا ابزارهای تصحیح خودکار املایی می توانند تأثیر بسزایی در جلوگیری از آسیب رسیدن به دست خط و زبان در هنگام نوشتن کاربران در فضای مجازی داشته باشند. این ابزارها ضمن کمک به سرعت نوشتن کاربر، اشتباهات سهوی کاربر را نیز اصلاح می کنند.
علاوه بر مزیت های ذکر شده در زمینه محتوا و پردازش خط و زبان فارسی در فضای مجازی، چالش های زیر را نیز در این زمینه می توان نام برد که باعث شده زبان فارسی جایگاه شایسته خود را در فضای مجازی پیدا نکند.
- عدم تمایل محققان و دانشگاهیان به انتشار نتایج تحقیقات خود به زبان فارسی در فضای مجازی
- عدم وجود نشریات علمی الکترونیکی معتبر به زبان فارسی در زمینه های مختلف علم و فناوری
- عدم سازماندهی صحیح پایگاه های علمی-پژوهشی فارسی
- عدم توجه به امکانات و قابلیت های فضای مجازی در جهت ارتقای مهارت های زبانی و ادبی عموم جامعه
- عدم استفاده صحیح از فرصت ها و قابلیت های ویژه فضای مجازی به منظور گسترش و آموزش خط و زبان فارسی به غیر فارسی زبانان و کودکان ایرانی خارج از کشور.
- عدم توجه به استفاده از ظرفیت های بین المللی به ویژه کشورهای فارسی زبان برای اجرای طرح های مشترک در زمینه های حفظ و ترویج خط و زبان فارسی و توسعه منابع زبانی و زیرساخت های پردازشی.
- عدم مشاهده تحلیلی و رویه های آینده پژوهی در خصوص وضعیت خط و زبان فارسی در فضای مجازی
موضوع مالکیت معنوی و استفاده تجاری از داده ها در کشور مشخص نشده است و مجوز استفاده و روند استفاده هنوز مشخص نیست.
چالش های دیگر در زمینه خوشنویسی و زبان فارسی
زبان روسی در چند سال اخیر به رشد خوب خود ادامه داده و بعد از زبان انگلیسی عنوان زبان دوم را دارد. زبان روسی نسبت به سایر زبان های قدرتمند مانند آلمانی و فرانسوی برتری قابل توجهی به دست آورده است.
در این راستا نیاز به ابزارها و سیستم های کارآمد برای پشتیبانی از استفاده از خط و زبان فارسی در فضای مجازی موضوع مهمی است که تاکنون به طور موثر به آن پرداخته نشده است و بازار این حوزه در کشور در دستان بزرگی است. پلتفرم هایی مانند گوگل . بنابراین تحقق مدیریت متمرکز و هدفمند دانش و فناوری در این زمینه، توسعه دهندگان و منابع و سیستم های پردازش زبان از الزامات ضروری در شرایط فعلی است.
در دسترس نبودن دادهها بهویژه دادههای متنی و محاورهای و همچنین تأمین زیرساختهای پردازش سختافزاری از جمله چالشهای فناوری در این زمینه است.
تاثیر فضای مجازی بر تغییر فونت و ساختار زبان فارسی
چالش های سمت تقاضا
تحریریه ICTNN شبکه خبری