Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Σε αυτή την περιοχή μπορείτε να βρείτε ή να αναζητήσετε πληροφορίες σχετικές με την PHP

Συντονιστές: WebDev Moderators, Super-Moderators, PHP Moderators

Απάντηση
invader7
Δημοσιεύσεις: 78
Εγγραφή: 24 Ιαν 2009 22:02

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από invader7 » 02 Ιούλ 2011 20:35

Χρειάστηκε να μεταφέρω άρθρα απο μια βάση σε μια νέα , για αυτό το σκοπό χρησιμοποίησα rss feed , διάβαζα τα νέα απο την βάση και δημιουργούσα feed. σε μερικά άρθρα είχα πρόβλημα με το formation του feed , κάπου χαλούσε. μερικά άρθρα είχαν την εξής μορφή

Κώδικας: Επιλογή όλων

 Ἡ ἀρχὴ τοῦ εὐαγγελίου τοῦ Ἰησοῦ Χριστοῦ τοῦ υἱοῦ τοῦ Θεοῦ
τι ακριβώς είναι αυτό ; και πώς θα μπορέσω να τα μετατρέψω σε χαρακτήρες Ελληνικούς για να μην έχω πρόβλημα ; στο feed χρησιμοποιώ σε 2 σημεία utf8

header("Content-Type: application/rss+xml; charset=utf-8");
και όταν ανοίγω την σύνδεση με την βάση
mysql_query("SET NAMES 'UTF8'");

Μπήκα με Phpmyadmin και είδα ότι είναι αποθηκευμένα με αυτή τη μορφή

Άβαταρ μέλους
jpk
Δημοσιεύσεις: 441
Εγγραφή: 09 Μαρ 2011 21:17

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από jpk » 02 Ιούλ 2011 20:46

http://htmlhelp.com/reference/html40/en ... mbols.html

Για κάποιο λόγο έχει γίνει η αντικατάσταση των γραμμάτων με html entities. Για να το βρεις ακολούθησε την διαδικασία που τα σώζεις από όταν εισάγονται. Αν χρησιμοποιείς κάποιο WYSIWYG (δηλαδή κάποιον editor σε HTML) οι περισσότεροι έχουν ρυθμίσεις για να μην χρησιμοποιούν html entities

(άσχετο – σχετικά … με το θέμα αλλά πλάκα-πλάκα … τόσο απλό και κάποιος δεν αναρωτήθηκε καν … και αν δεν ξέρει να ψάξει … να ρωτήσει …)

invader7
Δημοσιεύσεις: 78
Εγγραφή: 24 Ιαν 2009 22:02

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από invader7 » 02 Ιούλ 2011 20:54

jpk έγραψε:http://htmlhelp.com/reference/html40/en ... mbols.html

Για κάποιο λόγο έχει γίνει η αντικατάσταση των γραμμάτων με html entities. Για να το βρεις ακολούθησε την διαδικασία που τα σώζεις από όταν εισάγονται. Αν χρησιμοποιείς κάποιο WYSIWYG (δηλαδή κάποιον editor σε HTML) οι περισσότεροι έχουν ρυθμίσεις για να μην χρησιμοποιούν html entities

(άσχετο – σχετικά … με το θέμα αλλά πλάκα-πλάκα … τόσο απλό και κάποιος δεν αναρωτήθηκε καν … και αν δεν ξέρει να ψάξει … να ρωτήσει …)
Καταρχήν σε ευχαριστώ για την απάντηση. τα άρθρα είναι απο Joomla οπότε χρησιμοποιήθηκε WYSIWYG , δεν με ενδιαφέρει (πλέον) πως έγινε αλλά το πως θα κάνω το ανάποδο :D να πάρω δηλάδη τα ελληνικά γράμματα , γνωρίζεις πως γίνεται ; θα ψάξω με βάση το html entities , σε ευχαριστώ

EDIT:
φαίνεται να παίζει έτσι

Κώδικας: Επιλογή όλων

$text = html_entity_decode($text, ENT_QUOTES, 'UTF-8');

Άβαταρ μέλους
jpk
Δημοσιεύσεις: 441
Εγγραφή: 09 Μαρ 2011 21:17

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από jpk » 02 Ιούλ 2011 21:01

Ίσως υπάρχουν αρκετές απαντήσεις «μπαλώματα» αλλά η δική μου είναι … όχι. Αν πεις ποιο WYSIWYG χρησιμοποιείς ευχαρίστως να σε βοηθήσω να βάλεις τα σωστά settings για να μην κάνει html entities.

Τώρα όσο αφορά την λέξη «Joo_la» πραγματικά δεν έχω καμία διάθεση να πω οτιδήποτε άλλο εκτός από το «ο καθείς εφ' ω ετάχθη»

Αν θες να βοηθήσουμε να λύσουμε αυτό το πρόβλημα ευχαρίστως δίνοντας παραπάνω πληροφορίες , αλλά μην ανοίξουμε κάποιο άλλο θέμα περί Joo_la …
(Υπάρχει σχετική ενότητα στο freestuff)

Άβαταρ μέλους
jpk
Δημοσιεύσεις: 441
Εγγραφή: 09 Μαρ 2011 21:17

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από jpk » 02 Ιούλ 2011 21:05

invader7 έγραψε: EDIT:
φαίνεται να παίζει έτσι

Κώδικας: Επιλογή όλων

$text = html_entity_decode($text, ENT_QUOTES, 'UTF-8');
Πας να το λύσεις στο αποτέλεσμα και όχι στην πηγή. Ναι υπάρχει περίπτωση να δουλέψει για λίγο έτσι … αλλά είναι «μπάλωμα» και σε κάποια φάση θα βγει στην επιφάνεια. Το θέμα είναι πόσο σε ενδιαφέρει αυτό το project. Αν είναι μια εργασία που απλά θα την παρουσιάσεις και μετά τελείωσε κάνε το έτσι αλλά αν είναι πραγματική παραγωγή βρες την πηγή αλλιώς θα αναγκαστείς να την βρεις στο μέλλον με μεγαλύτερα προβλήματα αλλαγής δεδομένων.

invader7
Δημοσιεύσεις: 78
Εγγραφή: 24 Ιαν 2009 22:02

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από invader7 » 02 Ιούλ 2011 21:07

το έκανα με

Κώδικας: Επιλογή όλων

$text = html_entity_decode($text, ENT_QUOTES, 'UTF-8');
δούλεψε ... αλλά το feed πάλι έχει πρόβλημα ... τι να πω... για ρίξε μια ματιά σε παρακαλώ

Κώδικας: Επιλογή όλων

This feed does not validate.
line 211, column 157: Invalid character in a URI: images/fygh stin aigipto.jpg (2 occurrences) [help]
... στ&#8052;ς - &#7977; βάπτιση το&#8166; Χριστο&#8166;&#41;</a></p>&#93;&#93;></description></item><item><titl ...
                                             ^
line 1135, column 84&#58; XML parsing error&#58; <unknown>&#58;1135&#58;84&#58; not well-formed &#40;invalid token&#41; &#91;help&#93;
... &#8166; &#7936;νθρώπου &#7952;π&#8054; τ&#8134;ς γ&#8134;ς &#7936;φιέναι &#7937;μαρτίας  τότε λέγει τ&#8183; παραλυτικ&#8183;· &#7960;γερ ...
                                             ^
In addition, interoperability with the widest range of feed readers could be improved by implementing the following recommendations.
line 107, column 198&#58; description should not contain relative URL references&#58; images/mathaios.jpg &#40;6 occurrences&#41; &#91;help&#93;
... ν τ&#8134;ς Βηθλε&#8050;μ &#7936;π&#8056; τ&#8056;ν &#7977;ρώδην&#41;</a></p>&#93;&#93;></description></item><item><titl ...
                                             ^
line 107, column 212&#58; item should contain a guid element &#40;8 occurrences&#41; &#91;help&#93;
... &#7936;π&#8056; τ&#8056;ν &#7977;ρώδην&#41;</a></p>&#93;&#93;></description></item><item><title><!&#91;CDATA&#91;Κεφ ...



invader7
Δημοσιεύσεις: 78
Εγγραφή: 24 Ιαν 2009 22:02

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από invader7 » 02 Ιούλ 2011 21:08

jpk έγραψε:
invader7 έγραψε: EDIT:
φαίνεται να παίζει έτσι

Κώδικας: Επιλογή όλων

$text = html_entity_decode&#40;$text, ENT_QUOTES, 'UTF-8'&#41;;
Πας να το λύσεις στο αποτέλεσμα και όχι στην πηγή. Ναι υπάρχει περίπτωση να δουλέψει για λίγο έτσι &#8230; αλλά είναι «μπάλωμα» και σε κάποια φάση θα βγει στην επιφάνεια. Το θέμα είναι πόσο σε ενδιαφέρει αυτό το project. Αν είναι μια εργασία που απλά θα την παρουσιάσεις και μετά τελείωσε κάνε το έτσι αλλά αν είναι πραγματική παραγωγή βρες την πηγή αλλιώς θα αναγκαστείς να την βρεις στο μέλλον με μεγαλύτερα προβλήματα αλλαγής δεδομένων.
δεν με ενδιαφέρει γιατί το έχει κάνει αυτό , μεταφέρομαι σε νέα εγκατάσταση και δουλεύει σωστά εκεί , τα αποθηκεύει στα ελληνικά. το θέμα μου είναι να μπορέσω να τα μεταφέρω... μέσω του feed

Άβαταρ μέλους
jpk
Δημοσιεύσεις: 441
Εγγραφή: 09 Μαρ 2011 21:17

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από jpk » 02 Ιούλ 2011 21:13

Όλα τα υπόλοιπα στα λέει μόνο του (απλά αγγλικά) αλλά το πρώτο line 211, column 157: Invalid character in a URI υποθέτω ότι είναι τα κενά που έχεις μέσα στο URL. Φτιάξε μια τάξη .. συνάρτηση &#8230; ότι νομίζεις που να παίρνει έναν τίτλο και να το κάνει valid για URL

Άβαταρ μέλους
jpk
Δημοσιεύσεις: 441
Εγγραφή: 09 Μαρ 2011 21:17

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από jpk » 02 Ιούλ 2011 21:18

invader7 έγραψε:δεν με ενδιαφέρει γιατί το έχει κάνει αυτό
Το έπιασα από την αρχή &#8230; δεν θες λύση κάποιο «μπάλωμα» θες&#8230;. Αν είσαι υπάλληλος εκεί σου εύχομαι να βρεις καλλίτερη δουλειά και να φύγεις όσο είναι καιρός πριν βγούνε όλοι αυτοί οι σκελετοί από την ντουλάπα (γιατί για να κάνεις κάτι τόσο απλό «φάντασμα που θα σε καταδιώξει» σκέψου τι έχουν κάνει με ποιο σύνθετα)
invader7 έγραψε: μεταφέρομαι σε νέα εγκατάσταση και δουλεύει σωστά εκεί , τα αποθηκεύει στα ελληνικά. το θέμα μου είναι να μπορέσω να τα μεταφέρω... μέσω του feed
Χρησιμοποιείς feed για να μεταφέρεις data από ένα server σε άλλον;
Τελευταία επεξεργασία από το μέλος jpk την 02 Ιούλ 2011 21:22, έχει επεξεργασθεί 1 φορά συνολικά.

invader7
Δημοσιεύσεις: 78
Εγγραφή: 24 Ιαν 2009 22:02

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από invader7 » 02 Ιούλ 2011 21:22

jpk έγραψε:Όλα τα υπόλοιπα στα λέει μόνο του (απλά αγγλικά) αλλά το πρώτο line 211, column 157: Invalid character in a URI υποθέτω ότι είναι τα κενά που έχεις μέσα στο URL. Φτιάξε μια τάξη .. συνάρτηση &#8230; ότι νομίζεις που να παίρνει έναν τίτλο και να το κάνει valid για URL
έχω μεταφέρει ήδη πάνω απο 3.000 αρθρα με ίδια γράμματα (όχι html entities αλλά ελληνικά) και λινκς και δεν είχα πρόβλημα , μόνο στην συγκεκριμένη κατηγορία έχω... και θέλω να δω τι φταίει....
jpk έγραψε:Το έπιασα από την αρχή &#8230; δεν θες λύση κάποιο «μπάλωμα» θες&#8230;. Αν είσαι υπάλληλος εκεί σου εύχομαι να βρεις καλλίτερη δουλειά και να φύγεις όσο είναι καιρός πριν βγούνε όλοι αυτοί οι σκελετοί από την ντουλάπα (γιατί για να κάνεις κάτι τόσο απλό «φάντασμα που θα σε καταδιώξει» σκέψου τι έχουν κάνει με ποιο σύνθετα)
μάλλον τα έχεις μπερδέψει λίγο.... το λέω άλλη μια φορά .... δεν με ενδιαφέρει γιατί έχουν δημιουργηθεί γιατί πολύ απλά ΔΕΝ θα ξαναδημιουργηθούν , μεταφέρω τα αρθρα σε νέα εγκατάσταση με νέο editor ο οποίος δεν τα δημιουργεί... δεν ξέρω πως αλλιώς να το γράψω...

Άβαταρ μέλους
jpk
Δημοσιεύσεις: 441
Εγγραφή: 09 Μαρ 2011 21:17

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από jpk » 02 Ιούλ 2011 21:27

invader7 έγραψε:μεταφέρω τα αρθρα σε νέα εγκατάσταση με νέο editor ο οποίος δεν τα δημιουργεί... δεν ξέρω πως αλλιώς να το γράψω...
Φίλε κάθε κάλλη διάθεση έχω να σου πω κάποια λύση (ακόμα και βλακεία να είναι θα έχεις κερδίσει που θα έχεις ακούσει άλλες απόψεις) αλλά πες το τι κάνεις για να πω ακόμα και την βλακεία μου. Μεταφέρεις δεδομένα με rss από έναν server σε άλλον; Τι εννοείς νέα εγκατάσταση με νέο editor; Επιμένω θέλεις λύση ή μπάλωμα; Αν θες λύση πες λίγα παραπάνω για το τι κάνεις &#8230;

invader7
Δημοσιεύσεις: 78
Εγγραφή: 24 Ιαν 2009 22:02

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από invader7 » 02 Ιούλ 2011 21:33

κοίταξε , βρήκα ένα site σε joomla που καλώς η κακώς δημιουργούσε html entities. έτσι έχουμε μια βάση γεμάτη με τέτοια άρθρα.

τώρα αυτό που θέλω να κάνω είναι να "διαβάζω" απο αυτήν την βάση όλα τα άρθρα και να τα περνάω σε ένα rss feed το οποίο θα δίνω σε ένα εργαλείο που βρήκα έτοιμο και θα τα περνάει στη νέα βάση ΧΩΡΙΣ να δημιουργεί html entities....

μέχρι τώρα έχω περάσει πάνω απο 3.000 άρθρα με ελληνικούς χαρακτήρες χωρίς κανένα πρόβλημα....

όταν όμως άρχισαν τα άρθρα με τα html entities άρχισαν τα προβλήματα .... και δεν ξέρω τι φταίει, έκανα το decoding αλλά πάλι δεν παίζει...

Άβαταρ μέλους
korgr
Honorary Member
Δημοσιεύσεις: 5067
Εγγραφή: 07 Οκτ 2008 18:30
Τοποθεσία: Corinth
Επικοινωνία:

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από korgr » 02 Ιούλ 2011 21:38

jpk αν κατάλαβα καλά παίρνει τα δεδομένα από μια παλιά εγκατάσταση joomla της οποίας ο editor δεν είχε ρυθμιστεί σωστά και παρήγαγε html entities. Τελεία εδώ, δεν θα ξαναχρησιμοποιηθεί αυτή η εγκατάσταση joomla.
Ο φίλος θέλει να πάρει τα άρθρα της παροπλισμένης εγκατάστασης και να τα εισάγει σε νέα εγκατάσταση joomla όπου το πρόβλημα του editor έχει αποκατσταθεί και αποθηκεύει (για τα νέα άρθρα) σωστά τους χαρακτήρες.
Το θέμα είναι να πάρει τα προβληματικά άρθρα (με οποιοδήποτε τρόπο του δουλέψει) και μετά να διαγράψει τους ...σκελετούς (παλιά εγκατάσταση joomla).

ΥΓ. Πόσες φορές έγραψα την λέξη joomla βραδυάτικα; Ας με φυλάει το σύμπαν από κάθε κακό :D

invader7
Δημοσιεύσεις: 78
Εγγραφή: 24 Ιαν 2009 22:02

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από invader7 » 02 Ιούλ 2011 21:42

korgr έγραψε:jpk αν κατάλαβα καλά παίρνει τα δεδομένα από μια παλιά εγκατάσταση joomla της οποίας ο editor δεν είχε ρυθμιστεί σωστά και παρήγαγε html entities. Τελεία εδώ, δεν θα ξαναχρησιμοποιηθεί αυτή η εγκατάσταση joomla.
Ο φίλος θέλει να πάρει τα άρθρα της παροπλισμένης εγκατάστασης και να τα εισάγει σε νέα εγκατάσταση joomla όπου το πρόβλημα του editor έχει αποκατσταθεί και αποθηκεύει (για τα νέα άρθρα) σωστά τους χαρακτήρες.
Το θέμα είναι να πάρει τα προβληματικά άρθρα (με οποιοδήποτε τρόπο του δουλέψει) και μετά να διαγράψει τους ...σκελετούς (παλιά εγκατάσταση joomla).

ΥΓ. Πόσες φορές έγραψα την λέξη joomla βραδυάτικα; Ας με φυλάει το σύμπαν από κάθε κακό :D
ακριβώς.... :D

Άβαταρ μέλους
jpk
Δημοσιεύσεις: 441
Εγγραφή: 09 Μαρ 2011 21:17

Τι είναι και πως μετατρέπονται αυτοί οι χαρακτήρες ;

Δημοσίευση από jpk » 02 Ιούλ 2011 21:49

κοίταξε , (που λες και εσύ) η ιδέα να διαβάσεις τα δεδομένα και να τα κάνεις RSS για να τα στείλεις ήταν επιεικώς λάθος. Αφού έχεις πρόσβαση στην βάση φυσικά δεν υπάρχει λόγος για τέτοια λογικά ακροβατικά.
Αλλά αφού έχεις που έχεις προχωρήσει με αυτόν τον τρόπο δες το link που σου έδωσα στην αρχή
http://htmlhelp.com/reference/html40/en ... mbols.html
και κάνε replace τα entities με τα ελληνικά γράμματα (πάντως ο κώδικας που έδωσες έδειχνε και άλλα λάθη εκτός από αυτό)
Τώρα θα σου δουλέψει να πάρεις ένα-ένα entity και να το κάνεις Ελληνικό γράμμα αλλά πραγματικά σου εύχομαι να φύγεις όσο το δυνατόν γρηγορότερα από όποιον σκέφτηκε αυτόν τον τρόπο μεταφοράς (αν είσαι εσύ απλά ψάξου λίγο)
korgr έγραψε:Πόσες φορές έγραψα την λέξη joomla βραδυάτικα; Ας με φυλάει το σύμπαν από κάθε κακό
Για αυτό και εγώ βάζω κάτω παύλα στα σκα_α και στο Joo_la&#8230; Πάντως για να σοβαρευτώ δεν είναι κακό για αυτό που είναι &#8230; το κακό αρχίζει όταν παίρνουμε ένα παιδικό προγραμματάκι που πετάει σκουπίδια στον κάδο και το πουλάμε ως ανάπτυξη εφαρμογής. Τα έχω ξαναπεί δεν με χαλάνε οι μεταπράτες που λένε ότι κάνουν αυτή την δουλειά &#8230; οι διάφορες εταιρίες που λένε ότι παράγουν με χαλάνε και πουλάνε σκ_τά Joo_la

Απάντηση

Επιστροφή στο “PHP Προγραμματισμός”

Μέλη σε σύνδεση

Μέλη σε αυτήν τη Δ. Συζήτηση: Δεν υπάρχουν εγγεγραμμένα μέλη και 0 επισκέπτες