חזרה לרשימת הפרויקטים
אלגוריתמים של למידת מכונה לסיווג נתוני ניקוד אשראי
Details
בק-אנד להדגמת ביצועים של אלגוריתמי ML שונים
המפתחים שלנו תכננו ופיתחו את מערכת הסיווג מבוססת שפת R עבור הלוואות ברירת מחדל/לא ברירת מחדל, המערכת מבוססת על הנקודות הבאות:
- טעינת נתונים וקידוד נתונים עבור סוגי נתונים קטגוריים,
- נורמליזציה של נתונים ועיבוד מקדים,
- דגימת נתונים,
- סיווג נתונים ואימות צולב להערכת ביצועים חזקה. המערכת מאפשרת בדיקה של 3 גרסאות של דגימת נתונים (דגימת יתר, תת-דגימה ודגימת bootstrap) ו-6 גרסאות של אלגוריתמי סיווג (KNN, SVM, רגרסיה לוגיסטית, stochastic gradient descent, עץ החלטות וrandom forest). כתוצאה מיישום אלגוריתמים, המשתמש מקבל מידע מפורט על ביצועי הסיווג באמצעות מדדים כמו MSE, סטטיסטיקות Kolmogorov-Smirnov ועקומות ROC. המערכת נפרסה על שרת AWS וחוברה באמצעות API לממשק האינטרנט. גם ממשק ה-API וגם ממשק האינטרנט פותחו על ידי מפתחי הווב שלנו. הדאגה העיקרית של הטמעת המערכת על השרת הייתה שימוש בזיכרון לעיבוד נתונים, שעבר בהצלחה אופטימיזציה של קוד לשימוש בזיכרון ובמשאבי חישוב.
- טעינת נתונים וקידוד נתונים עבור סוגי נתונים קטגוריים,
- נורמליזציה של נתונים ועיבוד מקדים,
- דגימת נתונים,
- סיווג נתונים ואימות צולב להערכת ביצועים חזקה. המערכת מאפשרת בדיקה של 3 גרסאות של דגימת נתונים (דגימת יתר, תת-דגימה ודגימת bootstrap) ו-6 גרסאות של אלגוריתמי סיווג (KNN, SVM, רגרסיה לוגיסטית, stochastic gradient descent, עץ החלטות וrandom forest). כתוצאה מיישום אלגוריתמים, המשתמש מקבל מידע מפורט על ביצועי הסיווג באמצעות מדדים כמו MSE, סטטיסטיקות Kolmogorov-Smirnov ועקומות ROC. המערכת נפרסה על שרת AWS וחוברה באמצעות API לממשק האינטרנט. גם ממשק ה-API וגם ממשק האינטרנט פותחו על ידי מפתחי הווב שלנו. הדאגה העיקרית של הטמעת המערכת על השרת הייתה שימוש בזיכרון לעיבוד נתונים, שעבר בהצלחה אופטימיזציה של קוד לשימוש בזיכרון ובמשאבי חישוב.
,