«Στοπ» στην παιδική πορνογραφία στο Facebook χάρη στη Microsoft

Τεχνολογικά Θέματα, Νέα και Ειδήσεις. Θέματα προς συζήτηση.

Συντονιστές: Super-Moderators, Reporters

Απάντηση
UnstoppabLe
Δημοσιεύσεις: 59
Εγγραφή: 06 Απρ 2011 11:00

«Στοπ» στην παιδική πορνογραφία στο Facebook χάρη στη Microsoft

Δημοσίευση από UnstoppabLe » 20 Μάιος 2011 12:14

Οι χρήστες του διαδικτύου μπορεί να διαφωνούν μεταξύ τους σε πολλά θέματα, αλλά σε ένα πράγμα υπάρχει πλειοψηφική συμφωνία: η παιδική πορνογραφία είναι απαίσια, και απάνθρωπη. Και αν υπάρχει μία ιστοσελίδα στην οποία δεν θέλουμε να τη βλέπουμε, αυτή είναι το Facebook.

Για το λόγο αυτό, το κοινωνικό δίκτυο υιοθέτησε μία νέα τεχνολογία της Microsoft σε συνεργασία με τον Hany Farid του Dartmouth College, ώστε η παρακολούθηση παράνομων φωτογραφιών να σταματήσει.

Η τεχνολογία που αναπτύχθηκε ονομάζεται PhotoDNA, και αυτό που κάνει είναι αρχικά να ελέγχει έναν τεράστιο όγκο πληροφοριών με πολύ μεγάλη ταχύτητα, και έπειτα να διασταυρώνει τις παράνομες φωτογραφίες σε μια τεράστια βάση δεδομένων ακόμα και αν αυτές έχουν περικοπεί ή επεξεργαστεί.

Κάθε χυδαία φωτογραφία λοιπόν, έχει τη δική της κατηγορία, και το PhotoDNA είναι σε θέση να τις εντοπίσει ακόμη και από ένα κομμάτι της.

Όταν ένα κοινωνικό δίκτυο έχει πάνω από μισό δισεκατομμύριο χρήστες, είναι σίγουρο ότι μέσα σε αυτούς θα υπάρχουν και πολλοί διεστραμμένοι που κάνουν εμπόριο παιδικής πορνογραφίας και πιστεύουν ότι το Facebook είναι ένας καλός χώρος για να αποθηκεύσουν τις φωτογραφίες τους.

Ας ελπίσουμε πως η κίνηση του Facebook να υιοθετήσει το PhotoDNA θα συνδράμει τα μέγιστα στον αγώνα κατά της παιδικής πορνογραφίας στο διαδίκτυο. Εμείς πάντως είμαστε αισιόδοξοι. Εσείς;

www.gugoo.gr

Άβαταρ μέλους
Zizo
Honorary Member
Δημοσιεύσεις: 2256
Εγγραφή: 29 Οκτ 2006 03:21
Επικοινωνία:

«Στοπ» στην παιδική πορνογραφία στο Facebook χάρη στη Microsoft

Δημοσίευση από Zizo » 20 Μάιος 2011 19:34

Θα ήθελα να μάθω περισσότερα για το πως δουλεύει αυτή η τεχνολογία στην δεύτερη παράγραφο.

Εντωμεταξύ... πως και τέτοια φάση? Έχω μάθει από παλιότερα θέματα πως η παιδική πορνογραφία όχι μόνο έχει σχεδόν εξαφανιστεί αλλά έχουν πιάσει και διάφορους είτε Ελλάδα/Λάρισα είτε εξωτερικό.

Ποιος θα τολμούσε να βάλει στο facebook?
Εικόνα
What you waiting for?

Άβαταρ μέλους
Cha0s
SysAdmin
Δημοσιεύσεις: 10250
Εγγραφή: 28 Ιούλ 2001 03:00

«Στοπ» στην παιδική πορνογραφία στο Facebook χάρη στη Microsoft

Δημοσίευση από Cha0s » 23 Μάιος 2011 14:17

Zizo έγραψε:Θα ήθελα να μάθω περισσότερα για το πως δουλεύει αυτή η τεχνολογία στην δεύτερη παράγραφο.

Εντωμεταξύ... πως και τέτοια φάση? Έχω μάθει από παλιότερα θέματα πως η παιδική πορνογραφία όχι μόνο έχει σχεδόν εξαφανιστεί αλλά έχουν πιάσει και διάφορους είτε Ελλάδα/Λάρισα είτε εξωτερικό.

Ποιος θα τολμούσε να βάλει στο facebook?
Είναι απλή η μέθοδος που ακολουθείται.

Πιάνουμε μία πλειοψηφία που μπορεί κάπως κάποτε να δημιούργησε κάποιο πρόβλημα στην υπόλοιπη κοινωνία, και βασισμένοι στο τι έκανε αυτή η πλειοψηφία περνάμε νέες μεθόδους και νόμους ελέγχου όλων των υπολοίπων.

Οπότε εσύ για χάρη 5-10-100-1000 διεστραμένων σε όλο τον πλανήτη, θα μπεις στο σχετικό «group» του FB/MS στην προκειμένη περίπτωση.

Δεν πειράζει που προγράμματα θα αναλύουν κάθε τι που ανεβάζεις και αν πέσει σε λάθος χέρια αυτή η τεχνολογία μπορεί να παρακολουθήσουν τον οποιονδήποτε.
Αρκεί να φύγουν από την μέση οι αλήτες της παιδικής πορνογραφίας!
Σαν να λέμε δεν πειράζει που σκότωσαν πόσους αθώους στο Αφγανιστάν, αρκεί να φύγουν οι «τρομοκράτες» από την μέση. Ο σκοπός αγιάζει τα μέσα ένα πράγμα.
Μόνο που δεν μας λένε ποτέ τον πραγματικό σκοπό ;)

Είναι σαν τα ναρκωτικά ένα πράγμα.
Αντί να μορφώσεις τον κόσμο, απλά τα απαγορεύεις και δημιουργείς την μεγαλύτερη προπαγάνδα στον κόσμο κατά των «ναρκωτικών» γιατί μία μειονότητα ανθρώπων πέθανε από κάποιες συγκεκριμένες ουσίες (ή ακόμα και ούτε καν από αυτές άμεσα).
Οπότε αυτομάτως έχεις ένα μοντέλο που μπορεί να φέρει κέρδος και έλεγχο των πολιτών.

Πας στο Αφγανιστάν, κάνεις takeover, καταστρέφεις κάθε είδος δουλειάς, τους αναγκάζεις να παράγουν όπιο, το οποίο εισάγεις μετά στην χώρα, το πουλάς στα πρεζάκια της αντίστοιχης ομόνοιας στο Αμέρικα, και μετά βγαίνεις σαν τρελός στις τηλεοράσεις να τρομοκρατήσεις τον κόσμο για τον πρόβλημα με τα ναρκωτικά.

Οπότε βάζεις εκατοντάδες μπάτσους παραπάνω να μαζεύουν 20χρονα με 1-2 τσιγάρα χασίς και τους πάνε φυλακή (ιδιωτική φυλακή στην Αμερική = για κάθε φυλακισμένο η φυλακή έχει κέρδος δηλαδή) αφού πρώτα έχουν δώσει τα κέρατα τους σε δικηγόρους κλπ και όλα αυτά επειδή είχαν πάνω τους κάτι το οποίο φυτρώνει στην φύση.

Αναλογίζεσαι πόσοι βγάζουν κέρδος από το να είναι παράνομη μία ουσία έτσι ή με τους πολέμους κατά της επιστημονικής φαντασίας που λέγεται τρομοκρατία;

Τίποτα δεν γίνεται σήμερα χωρίς κύριο γνώμονα το κέρδος και την δύναμη/εξουσία.


Καλά όλα τα touchy κειμενάκια περί παιδικής πορνογραφίας και πως θα την καταπολεμήσει το FB και η MS (η οποία όλως περίεργως ξαφνικά κάνει takeover Skype, Nokia με νέο τεράστιο userbase - τυχαίο; ) αλλά είναι σαν το Patriot Act της Αμερικής.

Εις το όνομα της δήθεν τρομοκρατίας που παπαγαλίζει όλος ο τύπος παγκοσμοίως, σου αφαιρούν συνταγματικά δικαιώματα το ένα μετά το άλλο.

Άρα πριν πούμε ναι καλή η κίνηση του FB και της MS, ας πάρουμε μία ανάσα να σκεφτούμε τι λένε.

Μιλάνε για ένα πρόβλημα εδώ και πόσα χρόνια το οποίο ναι μπορεί να υπάρχει.
Αλλά δεν είναι τόσο τραγικό αν υπάρχει (ακόμα).
Υπάρχουν πραγματικά νούμερα κάπου για το τι γίνεται με την παιδική πορνογραφία σήμερα;

Δεν έχω πετύχει κανένα πιτσιρίκι γυμνό στο FB.
Όπως αντίστοιχα δεν είχαν καμία -πραγματική- τρομοκρατική επίθεση στην Αμερική (πιάνεις τον παραλληλισμό έτσι; )

Οπότε για κάτι το οποίο δεν έχουμε πετύχει οι περισσότεροι και απλά υπάρχει στο πίσω μέρος του μυαλού μας γιατί μας το πιπιλάνε δέκα+ χρόνια τώρα μας λένε ότι θα μας ελέγχουν κάθε φωτογραφία μας.
Όπως αντίστοιχα κάνανε πλύση εγκεφάλου σε όλο τον πλανήτη για τους πολέμους κατά της τρομοκρατίας ή των ναρκωτικών - ή αλλιώς πόλεμο που δεν πρόκειται να τελειώσει ποτέ γιατί και στις 2 περιπτώσεις πολεμάς «φαντάσματα».

Δεν μας λένε όμως ότι μαζί με το να ελέγχει το σύστημα για παιδική πορνογραφία, εφόσον καταφέρανε αυτό, θα μπορεί να ελέγχει δεκάδες άλλα πράγματα.

Οπότε που ξέρω εγώ ότι σε 5 χρόνια δεν θα αλλάξει χέρια και πολιτική το FB και όλα αυτά τα δεδομένα δεν αρχίζουν να τα κάνουν διαθέσιμα σε άλλους οργανισμούς (κυβερνητικούς ή μη) εις το όνομα της επόμενης «παιδικής πορνογραφίας» ή «τρομοκρατίας» ή ότι άλλο επικαλεστούν για να περιορίσουν το Internet και να το φέρουν στα δικά τους μέτρα;

Άβαταρ μέλους
soteres2002
S. & H. Moderator
Δημοσιεύσεις: 1524
Εγγραφή: 05 Μαρ 2004 22:17
Τοποθεσία: Ιωάννινα

«Στοπ» στην παιδική πορνογραφία στο Facebook χάρη στη Microsoft

Δημοσίευση από soteres2002 » 23 Μάιος 2011 21:15

Ως ερευνητής που ασχολείται ακριβώς με το πρόβλημα της ευφυούς αναγνώρισης πορνογραφίας ~2.5 χρόνια τώρα, ας κάνω κι εγώ μία μικρή αντίστροφη ανάλυση για την τεχνολογία αυτή, για όσους του ενδιαφέρει να μάθουν περισσότερα, μιας και δεν υπάρχει δημοσιευμένο με επίσημους όρους κάτι που να αφορά την τεχνολογία τους.

Κατ αρχάς να αναφέρω ότι η αναγνώριση πορνογραφίας με λογισμικό δεν είναι κάτι καινούριο στην υπολογοστική όραση / μηχανική μάθηση. Υπάρχουν δημοσιευμένες μελέτες από το '93 για το πρόβλημα αυτό, ο πρώτος ερευνητής που μελέτησε και πρωτοδημοσίευσε αναφορικά με το πρόβλημα αυτό είναι ο David Forsyth, από το University of California at Berkeley (τώρα full professor @ University of Illinois at Urbana Champaign).

Πλέον, από το 2005 και μετά οι μέθοδοι που έχουν προταθεί δίνουν state-of-the-art αποτελέσματα που επιτυγχάνουν ποσοστά επιτυχίας ώς και 99% (σε σύνολα δεδομένων που έχουν συλλέξει ερευνητές). Επίσης, οι χρόνοι απόκρισης των τεχνικών αυτών έχουν πλέον πέσει κάτω από το 1 second user-perceived processing time κατά μέσο όρο, πράγμα που δηλώνει ότι τέτοια συστήματα μπορούν να χρησιμοποιηθούν σε real-time εφαρμογές.

Βλέπωντας το σχετικό βίντεο στο site της microsoft για την τεχνολογία του PhotoDNΑ, ειλικρινά έχω μείνει άναυδος. Κατ αρχάς με βάση τα όσα γνωρίζουμε μέχρι στιγμής το PhotoDNA είναι το δεύτερο κατά σειρά σύστημα αναγνώρισης πορνογραφίας σε εικόνες που λειτουργεί σε peta-scale. Η πρώτη δημιοσιευμένη έρευνα σε large-scale systems έγινε από τους Rowley, Baluja et al, 2 ερευνητές στην Google research (πρόκειται για το Safe Search της Google). Θα ήθελα πριν συνεχίσω να πω ότι μένω έκπληκτος από την απλότητα του photoDNA. Ουσιαστικά για ότι αφορά την υπολογιστική όραση, δεν έχει γίνει καμία μεγαλειώδης καινοτομία. Η καινοτομία είναι η εφαρμογή του συστήματος σε real-world large-scale datasets. Η ιδέα είναι ότι δοθείσης μιας εικόνας μπορεί να κανείς να υπολογίσει μία ταυτότητα (ελληνιστί hash) για την εικόνα αυτή, ούτως ώστε αν έχει κανείς και ένα μεγάλο σύνολο από hashes πορνογραφικών και μη πορνογραφικών εικόνων να μπορεί να ταιριάξει (κατά τον απλούστερο δυνατό τρόπο το υπολογισμένο hash της εικόνας με το hash κάποιας εικόνας που ελαχιστοποιεί κάποια απόσταση μεταξύ των δύο hashes. Πχ αν βρώ μία εικόνα porn με hash Η2 και η εικόνα μου έχει hash Η1 τότε, αν η εικόνα αυτή ελαχιστοποιεί μία απόσταση d(H1, H2) τότε ταξινομώ την εικόνα ώς πορνογραφική. Στο σημείο αυτό, να αναφέρω πως βάση της δικής μου γνώσης, η μέθοδος που χρισιμοποιεί το photoDNA είναι ευρεως διαδεδομένη στην βιβλιογραφία. Ουσιαστικά η τεχνική τους βασίζεται σε μία τεχνική δειγματοληψίας της κατανομής χρώματος της εικόνας. Παρόμοιες τεχνικές είχαν ήδη προταθεί και πολύ παλιότερα (όποιος ενδιαφέρεται να με ρωτήσει με ΠΜ).

Ουσιαστικά, λαμβάνοντας την grayscale εικόνα μίας έγχρωμης εικόνας (αυτό μπορεί να γίνει παίρνοτας το μέσο όρο των εντάσεων του RGB), τμηματοποιεί το επίπεδο σε υποεπίπεδα ίσων διαστάσεων το καθένα. Στη συνέχεια, η εικόνα κλιμακώνεται σε συγκεκριμένες διαστάσεις. Με βάση τις υπο-περιοχές της εικόνας υπολογιζονται τα ιστογράμματα εντάσεων (δηλαδή 3Δ πίνακες που να λέει πόσα πίξελ με τιμή (R, G, B) υπάρχουν στην περιοχή αυτή). Στη συνέχεια (και λογικά χρησιμοποιώντας τεχνικές ταιριάσματος ιστογράμματος, εκμεταλλεύονται την διαθεσιμότητα ενός τεράστιου dataset πορνογραφικών και μη εικόνων και συγκρίνουν με όλες αυτές τις εικόνες (υποθέτω μάλιστα δεδομένης της απλότητας του αλγορίθμου τους, ίσως η ύπαρξη ενός μεγάλου dataset να κάνει βιώσιμη την μέθοδο αυτή στον πραγματικό κόσμο).

Δεν σταματάει όμως εδώ η ιστορία... Η καινοτομία του συστήματος είναι ότι τα ιστογράμματα αυτά είναι στην ουσία ένα αποτύπωμα "DNA" για την εικόνα, ακριβώς όπως είναι το DNA μας. Εχοντας λοιπόν στην διάθεσή τους ενα τεράστιο dataset μπορούν με χρήση ταχύτατων κατανεμημένων αλγορίθμων να βρουν best-matches και να ταξινομήσουν την εικόνα. Αν έχεις πχ όλο το Google infrastructure 500.000 μηχανημάτων το matching μπορεί να γίνει και σε milliseconds... Για μένα με βάση τα όσα έχω δει και κρίνει, μιας και δεν έχει βγει επίσημη δημοσίευση για το σύστημα αυτό, δεδομένου ότι η τεχνική τους δεν έχει ουσιαστικά να προτείνει κάτι novel η καινοτομία έγγυται στο γεγονός ότι μπορεί κανείς να εκμεταλλευτεί το crowdsourcing (ενδεχομένως) όπου ένα crowd αναλαμβάνει να ταξινομήσει ένα σύνολο εικόνων 6 εκατομμυρίων. Στη συνέχεια, δεδομένου ότι το σύνολο αυτό είναι και αντιπροσωπευτικό του συνόλου των εικόνων βρίσκουμε best matches, μέσω τεχνικών DNA sequence string matching (λογικά κάποιο τέτοιο αλγόριθμο θα έχουν κατασκευάσει). Όπως μάλιστα διάβασα και σε κάποια πηγή, ο Hanny Farid του Dartmouth College, είχε αναφέρει ότι στο large-scale σύνολο δεδομένων είχαν πρόβλημα με false-alarms, δηλαδή ο αλγόριθμος τους είχε σοβαρό πρόβλημα με την ταξινόμηση εικόνων: συγκεκριμένα μπέρδευε κανονικές εικόνες με πορνογραφικές (δεν μου κάνει έκπληξη, δεδομένης της εξαιρετικής απλότητας του αλγορίθμου τους).

Πάντως μέχρι εδώ, τηρώ τις επιφυλάξεις μου για το πόσο καλά θα δούλευε η τεχνική αυτή σε datasets 1000 εικόνων, ότι κάνουν δηλαδή και οι υπόλοιποι ερευνητές που δημοσιεύουν στο πρόβλημα αυτό! Το clue είναι ότι εκμεταλλευόμενος την πληθόρα ένος μεγάλου dataset μπορεί κανείς να ταξινομήσει με μικρά λάθη, παρά την ύπαρξη outlier samples στο dataset. Επίσης, οι μετρικοί χώροι χαρακτηριστικών (όπως συνήθως λέγονται) έχουν καλές ιδιότητες και μπορούν να χρησιμοποιηθούν "αφελείς" αλγόριθμοι κοντινότερου γείτονα για τον υπολογισμό βέλτιστων ταιριασμάτων. Δεδομένων και των μεθοδολογιών για να μετατρέψει κανείς έναν τέτοιο αλγόριθμο σε κατανεμημένο, μπορεί κανείς να αναζητήσει "1 καρφίτσα ανάμεσα σε 1 δισεκατομμύριο άχυρα" πχ με Hadoop πάνω από 500.000 PCs, σε πολύ λίγο χρόνο (πχ τάξης των milliseconds).

Το clue της υπόθεσης είναι ότι με πολύ χαμηλό processing time για την εξαγωγή του hash μπορούν μέσω distributed DNA sequence matching αλγορίθμων να βρίσκουν best matches και να ταξινομούν την πληροφορία πριν την δει ο "ανύποπτος" χρήστης....

Για ότι ακούγεται εξωγήινο στα πιο πάνω ρωτήστε εδώ... :wink:

Alehandro
Δημοσιεύσεις: 26
Εγγραφή: 19 Δεκ 2009 13:50
Τοποθεσία: Ηλιούπολη
Επικοινωνία:

«Στοπ» στην παιδική πορνογραφία στο Facebook χάρη στη Microsoft

Δημοσίευση από Alehandro » 25 Μάιος 2011 16:40

Cha0s έγραψε:...
+++

Απάντηση

Επιστροφή στο “Τεχνολογικά Θέματα, Νέα και Ειδήσεις”

Μέλη σε σύνδεση

Μέλη σε αυτήν τη Δ. Συζήτηση: Δεν υπάρχουν εγγεγραμμένα μέλη και 0 επισκέπτες