יום חמישי , יוני 29 2017
בית » חדשנות » אני יודע מה ראית בקיץ האחרון

אני יודע מה ראית בקיץ האחרון

מאת: מערכת הבלוג

אודות הכתב

רן דובין הוא מומחה לרשתות תקשורת והגנת סייבר ויועץ לבית המשפט המחוזי בתביעות ייצוגיות בנושאים אלו. הוא דוקטורנט במחלקה להנדסת מערכות תקשורת ומחקרו התמקד באופטימיזציה של שידורי ווידאו אדפטיביים ברשת תחת הנחייתו של פרופ' עופר הדר וד"ר עמית דביר. מחקרו הוצג בכנס האבטחה London 2016 Blackhat ומומן בחלקו על ידי מטה הסייבר הלאומי, ובשיתוף עם ד"ר אופיר פלא מאונ' אריאל.

תודות לתעבורת אינטרנט מוצפנת אנחנו מרגישים בנוח ויודעים שמה שאנחנו עושים בווגאס נשאר בווגאס, או לפחות בגבולות המחשב הפרטי שלנו. אבל מחקרים רבים כבר הראו שההנחה כי תעבורה מוצפנת מוגנת לחלוטין בפני תוקפים אינה נכונה. למרות ההצפנה, עדיין אפשר להפיק מידע רב, ללא צורך בפריצת ההצפנה. אמנם אין גישה לתוכן המידע, אבל בהחלט ניתן לאסוף אינפורמציה לגבי מערכת ההפעלה, הדפדפן, פרוטוקול האפליקציה ואופן השימוש.

לוגואים של Youyubeחוקרים מהמחלקה להנדסת מערכות תקשורת ביקשו לבדוק האם זה נכון גם כאשר צופים בסרטונים בפלטפורמת ה- Youtube ומצאו שבהחלט ניתן להפיק תובנות מתוך תעבורת ה- YouTube המוצפנת, כמו למשל שם הסרטון הנצפה.

איסוף המידע הבשיל בעקבות מחקר מעמיק כיצד שירות הווידאו עובד, איך תוכן הווידאו מקודד, מהי הצורה שבה נגן הווידאו מבקש את המידע ואילו תבניות ניתן למצוא במידע במהלך הפצתו. איסוף הפרמטרים האלו אפשר לנו ליצור מכונת למידה פשוטה וחזקה שמזהה באחוזים גבוהים איזה סרטון ספציפי ראיתם כרגע מתוך סט סרטים ידוע מראש.

איך עקפנו את ההצפנה?

כל מערכת למידה בנויה משני שלבים: שלב האימון ושלב הבדיקה. בשלב האימון מאמנים את המסווג על מאגר נתונים גדול מספיק. בשלב השני, שלב הבדיקה, לוקחים את מידע הבדיקה (מידע שלא שימש ללמידה) ובודקים את אחוזי הצלחת הסיווג של המערכת. כדי להוריד את הסרטים בצורה אוטומטית פיתחנו כלי ייעודי שמאפשר לדמות את התנהגות הצפייה של משתמשים אמיתיים ברשת ע"י פתיחת דפדפן וביצוע פעולות באתרים. הכלי מאפשר הכנסה של רעשי רשת מדומים על מנת לייצר מצבים מגוונים שיאתגרו את מערכת הלמידה.

מתוך הניסיון הרב של הקבוצה בזיהוי תעבורה מוצפנת נבדקו למעלה מ 70 מאפייני רשת אשר מטרתם הייתה לתאר את תכונות התעבורה המוצפנת ולאפשר זיהוי מדויק של כל סרט. מכיוון שיצירת מאפינים בזמן אמת היא פעולה יקרה מצאנו שניתן להשיג תוצאות מיטביות בעזרת מאפיין בודד אשר  סוכם את כמות המידע בהתאם לבקשת המשתמש ברשת. מאפיין זה נבדק תחת תנאי רשת שונים ונמצא אידיאלי לבעיה זו.  לאחר יצירת המאפיין השתמשנו בפונקצית דימיון ייעודית שנמצאה יעילה, עם כמות מינימלית של טעויות מול סרטים לא מוכרים.

תמונת מסך של סרטון מ-Youtube

 למה זה טוב?

כיוון ש YouTube היא פלטפורמת הפצת הווידאו החברתית הגדולה בעולם והיא משמשת לא רק להפצת מוזיקה אלא גם להעברת דעות והפגנות, ליכולת להפיק תובנות מתעבורת ה- YouTube יש חשיבות רבה. במסגרת המחקר, לא רצינו לזהות סרטים מתוך מגוון אין-סופי של סרטים נצפים,  אלא לזהות צפייה רק בסט סרטים שסימנו כחשודים. היכולת להבין אילו משתמשים צופים בקבוצת הסרטים מאפשרת להחזיר למשחק יכולות שהיו זמינות טרם עידן התעבורה המוצפנת. לזיהוי יש פן חיובי במקרה ומדובר בתא טרור, אך כמו במקרים רבים אחרים, מדובר בפגיעה בפרטיות ולכן המטרה הראשית של המחקר היא להמחיש שההצפנה שקיימת היום אינה מאפשרת להסתיר באילו סרטים אנשים צופים.

שימוש אזרחי אפשרי בעקבות המחקר הוא מעקב אחרי פרסומות וספירת כמות הפרסומות אליהן משתמשים נחשפים בפלטפורמה מסוימת, שהוא מידע בעל ערך בתעשיות הפרסום והשיווק המקוונות. שימוש עתידי נוסף, שעדיין בשלבי מחקר, הוא מעקב אחר איכות הסרט אצל המשתמשים (ללא פתיחת ההצפנה). ספקי שירותי האינטרנט שלנו רוצים לדעת שאכן ניתנת למשתמשים איכות טובה ורציפה, והתעבורה המוצפנת הופכת את השגת המידע לאתגר עצום ולנושא חם בתעשייה.

אודות מערכת הבלוג

מערכת הבלוג
ibgu.ac.il הינו בלוג חדשנות, מדע וטכנולוגיה של אוניברסיטת בן-גוריון בנגב.