Υπότιτλοι για ζωντανή μετάφραση στο FaceTime

Η Areeba Kamal, υπεύθυνη προϊόντων τεχνητής νοημοσύνης στην Apple, απάντησε σε αυτό το ερώτημα σε συνέντευξή της στην εφημερίδα Le Figaro . Δήλωσε:

Θεωρούμε το FaceTime ως ένα εργαλείο επικοινωνίας με στενούς φίλους και συγγενείς που μιλούν διαφορετική γλώσσα. Θέλουμε οι χρήστες να μπορούν να βλέπουν το άτομο με το οποίο μιλάνε και να ακούν πραγματικά κάθε απόχρωση, κάθε γέλιο στη φωνή του, ακόμα κι αν έχουν διαθέσιμους υπότιτλους. Ωστόσο, κατά τη διάρκεια μιας τηλεφωνικής κλήσης ή μιας ηχητικής κλήσης FaceTime, το σύστημα μειώνει την ένταση της φωνής και αυξάνει την ένταση του μεταφρασμένου ήχου. Με αυτόν τον τρόπο, παραμένετε ενήμεροι ότι το άτομο μιλάει, για τις εκφράσεις του, χωρίς αυτό να σας αποσπά την προσοχή.

Η υπόλοιπη συνέντευξη, η οποία είναι αρκετά σύντομη, δεν προσφέρει πολλές νέες πληροφορίες που δεν ήταν ήδη γνωστές σε όσους παρακολουθούν τα νέα της Apple. Ο Ron Huang, αντιπρόεδρος συνδεσιμότητας της Apple, εξηγεί, για παράδειγμα, ότι τα μοντέλα μετάφρασης εκτελούνται τοπικά στο iPhone χρησιμοποιώντας το Apple Intelligence. Μιλάει επίσης για τα AirPods:

Έπρεπε επίσης να επαναρυθμίσουμε τα μικρόφωνα των AirPods ώστε να καταγράφουν ήχο από απόσταση. Μετά από χρόνια βελτιστοποίησής τους για την καταστολή του θορύβου του περιβάλλοντος και την επίτευξη καθαρών τηλεφωνικών κλήσεων, κάναμε το αντίθετο για να καταγράψουμε τις φωνές των ανθρώπων γύρω από τον χρήστη.

Ο Areeba Kamal προσθέτει μια ενδιαφέρουσα περίπτωση χρήσης για iPhone χωρίς Apple Intelligence:

Έχουμε αναπτύξει πολλές ενδιαφέρουσες τεχνολογίες για να ζωντανέψουμε όλα αυτά. Για παράδειγμα, όταν χρησιμοποιείτε το Live Translate στην εφαρμογή Τηλέφωνο, μπορείτε να καλέσετε κάποιον με ένα παλαιότερο iPhone, μια διαφορετική μάρκα smartphone ή ακόμα και ένα σταθερό τηλέφωνο. Χάρη στο Apple Intelligence και το Live Translation, και τα δύο μέρη στη συνομιλία μπορούν να παρακολουθήσουν την εμπειρία της προφορικής μετάφρασης.

Ενδέχεται να είναι διαθέσιμες και άλλες γλώσσες

Υπάρχει επίσης το ζήτημα των γλωσσών που υποστηρίζονται από ζωντανή μετάφραση στο FaceTime. Προς το παρόν, υποστηρίζονται 10 γλώσσες. Η Apple θα προσθέσει περισσότερες με την πάροδο του χρόνου, αλλά αυτό απαιτεί δουλειά. «Η προετοιμασία μιας γλώσσας απαιτεί εκατοντάδες χιλιάδες ώρες αξιολόγησης », αναγνωρίζει η Areeba Kamal.

Από την πλευρά του, ο Ron Huang λέει ότι η Apple «συνέλεξε πραγματικές συνομιλίες σε καφετέριες, εστιατόρια και διάφορα περιβάλλοντα για να διασφαλίσει ότι τα προσομοιωμένα δεδομένα αντιπροσωπεύουν με ακρίβεια τον πραγματικό κόσμο ». Προσθέτει ότι η εταιρεία αφιέρωσε «χιλιάδες ώρες δοκιμάζοντας διαφορετικές θέσεις μικροφώνων και ηχείων. Ο προσανατολισμός του τηλεφώνου έχει πραγματικά σημασία κατά τη διάρκεια της συνεδρίας μετάφρασης. Χρησιμοποιούμε τόσο τα μικρόφωνα των AirPods όσο και του iPhone, προτιμώντας αυτό που αποτυπώνει καλύτερα την ομιλία » .