[ad_1]

تیم های IT باید با مدیرانی که بر محققان داده ، مهندسان داده و تحلیل گران نظارت می کنند ، برای توسعه نکات مداخله ای که تکنیک های گروه مدل را تکمیل می کنند ، کار کنند.

بیشتر مدیران وقتی فناوری را که برای بهبود گردش کار یک تیم یا سازمان طراحی شده است ، سرخوشی می کنند. اما آنها غالباً از جزئیاتی که به اجرای موفقیت آمیز فناوری کمک می کند ، چشم پوشی می کنند. همین احساسات می تواند در میان مدیرانی که دانشمندان داده ، مهندسان داده و تحلیل گران را مشاهده می کنند و ابتکار عمل یادگیری ماشین را مشاهده می کنند ، رخ دهد.

به نظر می رسد که هر سازمانی عاشق یادگیری ماشین است. به اصطلاح عشق کور است ، تیم های فناوری اطلاعات اولین خط دفاعی در دفاع از این احساس سرخوشی می شوند. آنها می توانند با کمک به مدیران در ارزیابی نحوه پاسخگویی مدل ها به مشاهدات منابع داده ، این محافظت را آغاز کنند. ارزیابی تعادل آماری در مدل های داده برای ایجاد حاکمیت ضروری است که خطاهایی را که منجر به راه حل های واقعی بسیار ضعیف می شوند به حداقل برساند. تجهیزات بیش از حد و ناکافی قسمت اصلی این بحث است.

اعتبار: WrightStudio از طریق Adobe Stock

اعتبار: WrightStudio از طریق Adobe Stock

تعدیل مجدد و تجهیزات ناكافی ، نحوه مقایسه داده های آموزش با ارائه داده های تولیدی مدل یا الگوریتم یادگیری ماشین را در نظر می گیرد. ممكن است تحلیلگر نمایش خوبی از داده های آموزش ببیند ، اما نتایج بدتر نیز وجود دارد ، در تولید

بنابراین چگونه همه اینها در عمل کار می کند؟ Overfit به این معنی است که وقتی نویز واقعاً تحریف شده باشد ، نویز موجود در داده های آموزش را به عنوان یک شاخص قابل اطمینان تلقی می کند. این مدل از هر مجموعه داده جدیدی که حاوی نویز مشابه یا هیچ سر و صدایی در آن نیست – یعنی داده های تولید – پیش بینی ضعیفی ایجاد می کند. از نظر آماری ، اگر مدل یا الگوریتم تعصب کم اما انحراف زیادی را نشان دهد ، تنظیم مجدد اتفاق می افتد

Underfit مسئله عملکرد متفاوتی را برای مدل ارائه می دهد. به طور مستقیم ، underfit فرض می کند که مدل یا الگوریتم تمام داده ها را به اندازه کافی خوب درک نمی کند تا بتواند روابط آماری بین داده ها را درک کند. از نظر آماری ، اگر مدل یا الگوریتم واریانس کم اما تعصب زیاد نشان دهد ، تنظیم ناکافی رخ می دهد.

هر دو مدل مدل ، تعمیم را به راه حل های ضعیف کاهش می دهد. خلاصه ها توانایی مدل های یادگیری ماشین برای دستیابی دقیق به داده های نامرئی است. دریافت خلاصه مناسب مبنای ایجاد یک مدل یادگیری ماشین خوب است.

یکی از راه های تحلیلگران بررسی داده های آموزشی برای تعیین امکان مشاهده های اضافی برای جلوگیری از افزودن مجموعه داده های نامتعادل به مدل ها است. من مجموعه داده های نامتعادل را قبلاً در پست قبلی توضیح دادم.

اما اضافه کردن مشاهدات یا افزودن ویژگی ها محدودیت هایی دارد. پدیده هایی وجود دارد که افزودن داده های بیشتر منجر به بهبود عملکرد بیشتر نمی شود. یک مثال پدیده هیوز نامیده می شود ، که نشان می دهد با افزایش تعداد ویژگی ها ، عملکرد مدل طبقه بندی تا حد تعداد مطلوب ویژگی ها افزایش می یابد و سپس با افزودن ویژگی های بیشتر بر اساس همان اندازه عملکرد ، عملکرد را کاهش می دهد. مجموعه آموزش. پدیده هیوز قطعاً باید لعنت بعد را به متخصصان داده یادآوری کند. تعداد ردیف های منحصر به فرد ممکن برای بسیاری از موارد ، مانند مدل های بزرگ ، به طور تصاعدی افزایش می یابد. همچنین با مشاهدات اضافی واریانس افزایش می یابد. نتیجه یک مدل با گزینه های بیشتر برای استتار است که خلاصه های دقیق را برای شناسایی و افزایش ناکارآمدی های توسعه دشوارتر می کند.

بنابراین ، محتمل ترین تلاش ها شامل یافتن تعادل بین سوگیری و انحراف است. داشتن تعصب و انحراف کم هدف مطلوبی است ، اما دستیابی به آن معمولاً غیر عملی یا غیرممکن است. تحلیلگران باید بر روی تکنیک های اعتبارسنجی متقابل ، مانند تقویت شیب دار تمرکز کنند تا احتمال اجرای یک مدل ضعیف را به حداقل برسانند.

تیم های فناوری اطلاعات نیاز به همکاری با مدیرانی دارند که بر محققان داده ، مهندسان داده و تحلیل گران نظارت می کنند تا نقاط مداخله ای را تکمیل کنند که تکنیک های گروه مدل را تکمیل می کنند. تعامل همچنین می تواند منجر به تشکیل فرایندهای مدیریت پایدار مانند نظارت برای تشخیص حوادث و در نظر گرفتن علل اصلی شود. نتیجه سیستمی است که خرابی عملیاتی مرتبط با مشکلات داده را به حداقل می رساند. همچنین یک نقطه فرایند برای مدیریت تعادل تعصبات و انحرافات ایجاد می کند ، که از دقت مدل محافظت می کند و نتایج عادلانه ای به دست می آورد.

سر و صدا سیگنال به معنای وجود اخلاق در نتیجه نیست. قضاوت خوب باعث می شود اخلاق در نتیجه اتفاق بیفتد. چنین نتایجی مسلماً شایسته احساس سرخوشی است.

مطالب مرتبط:

اصول یادگیری ماشینی همه باید بدانند

چگونه AI ، ML و NLP را به زبان ساده برای رهبران تجارت توضیح دهیم

چگونه می توان پرسنل خود را برای هوش مصنوعی و یادگیری ماشین بهبود بخشید

Pier DeBois بنیانگذار Zimana ، یک شرکت مشاوره تجزیه و تحلیل کسب و کار کوچک است که داده های راه حل های تجزیه و تحلیل وب و داشبورد رسانه های اجتماعی را بررسی می کند ، سپس توصیه ها و اقداماتی را برای توسعه وب ارائه می دهد که استراتژی بازاریابی و سودآوری تجارت را بهبود می بخشد. او … بیوگرافی کامل را ببینید

ما از نظرات شما در مورد این موضوع در کانال های رسانه های اجتماعی خود استقبال می کنیم ، یا [contact us directly] با س questionsالات در مورد سایت.

مقالات بیشتر



[ad_2]

منبع: tasiveh-news.ir