147 lines
4.5 KiB
Plaintext
147 lines
4.5 KiB
Plaintext
|
## Juli 2018
|
|||
|
|
|||
|
I <20> Unicode
|
|||
|
"insert topic here" Unicode ?! -\> Mojibake!
|
|||
|
ooder I <20> Unicode :)
|
|||
|
|
|||
|
*Vorstellung*
|
|||
|
|
|||
|
### News:
|
|||
|
|
|||
|
\* Datenspuren rücken näher -\> CFP So 29. Juli 2018
|
|||
|
<https://frab.cccv.de/en/DS2018/cfp>
|
|||
|
\* die neue Datenschleuder ist da! (20.Juli.2018)
|
|||
|
\* Hausdurchsuchungen im Chaosumfeld (Zwiebelfreunde)
|
|||
|
|
|||
|
<https://www.ccc.de/de/updates/2018/unrechtmaige-hausdurchsuchung-polizei-reitet-erneut-beim-chaos-computer-club-ein>
|
|||
|
|
|||
|
<https://logbuch-netzpolitik.de/lnp260-eine-hausdurchsuchung-kommt-selten-allein>
|
|||
|
|
|||
|
\* Arbeitseinsatz im Zentralwerk am 28.
|
|||
|
\* 30K fuer heisse Luft erfolgreich
|
|||
|
\* Fast 40k erreicht
|
|||
|
\* weiterer Plan?
|
|||
|
\* Dank an alle Spender
|
|||
|
|
|||
|
\* Upload Filter
|
|||
|
<https://www.heise.de/tp/features/Ein-trauriger-Tag-fuer-das-Internet-und-Europa-4087651.html>
|
|||
|
|
|||
|
\* Google Rant
|
|||
|
|
|||
|
\* Öffi app wird bei google ausgeworfen (jetzt exklusiv bei
|
|||
|
F-Droid) - google monopol problem
|
|||
|
\*
|
|||
|
<https://www.heise.de/newsticker/meldung/Google-entfernt-Nahverkehrs-App-Oeffi-aus-dem-Play-Store-4104626.html>
|
|||
|
\*
|
|||
|
<https://www.heise.de/newsticker/meldung/4-3-Milliarden-Euro-EU-Kommission-verhaengt-Rekordstrafe-gegen-Google-4113754.html>
|
|||
|
|
|||
|
Außerdem untersagt es Google den Herstellern, Geräte mit
|
|||
|
Android zu verkaufen, wenn sie gleichzeitig auch Modelle mit
|
|||
|
abgewandelten Versionen des Betriebssystems im Angebot haben.
|
|||
|
\*
|
|||
|
<https://de.statista.com/infografik/10029/strafen-fuer-wettbewerbsverstoesse-in-der-eu/>
|
|||
|
|
|||
|
<https://bitwarden.com/>
|
|||
|
<https://www.mail-archive.com/python-committers@python.org/msg05628.html>
|
|||
|
|
|||
|
Optional
|
|||
|
// <https://www.theregister.co.uk/2018/07/03/stork_mobile_theft/>
|
|||
|
// Macmoon <http://www.worldofindie.co.uk/?p=682>
|
|||
|
// PeerTube!
|
|||
|
|
|||
|
"Nach der Musik geht es weiter mit..." *Morse-Code vom Wort "Unicode"*
|
|||
|
|
|||
|
*Musik*
|
|||
|
|
|||
|
### Encoding Geschichte
|
|||
|
|
|||
|
**Morse Code**
|
|||
|
<https://de.wikipedia.org/wiki/Morsezeichen> -\> auch mal vorspielen und
|
|||
|
erklären
|
|||
|
-\> konstantes Signal ein- und ausgeschaltet
|
|||
|
-\> Ton Funk, Mechanisch oder Licht
|
|||
|
|
|||
|
Samuel Morse 1833 Der verwendete Code umfasste damals nur die zehn
|
|||
|
Ziffern; die übertragenen Zahlen mussten mit Hilfe einer Tabelle in
|
|||
|
Buchstaben und Wörter übersetzt werden.
|
|||
|
Alfred Lewis Vail, ein Mitarbeiter Morses, entwickelte ab 1838 den
|
|||
|
ersten Code, der auch Buchstaben umfasste. Er bestand aus Zeichen von
|
|||
|
drei verschiedenen Längen und unterschiedlich langen Pausen.
|
|||
|
|
|||
|
Ein Seenotruf wurde erstmals 1909 über Funk gemorst. ... --- ...
|
|||
|
Bis 2003 vorgeschrieben für Amateurfunk für unter 30MHZ
|
|||
|
heute noch für Funkfeuer und UNESCO KulturErbe
|
|||
|
|
|||
|
----- Soundfile morse_A abspielen ----
|
|||
|
A** · −**
|
|||
|
|
|||
|
**binary** - Wie werden Zahlen am Computer dargestellt?
|
|||
|
|
|||
|
A chr(65) 01000001
|
|||
|
|
|||
|
**ASCII**
|
|||
|
<https://de.wikipedia.org/wiki/American_Standard_Code_for_Information_Interchange>
|
|||
|
|
|||
|
**ANSI**
|
|||
|
<https://de.wikipedia.org/wiki/ANSI-Zeichencode>
|
|||
|
Windows Codeseite 1252 auf einem ANSI-Entwurf beruhte, der später
|
|||
|
weitgehend zum ISO Standard 8859-1 wurde
|
|||
|
windows1252 -\> word files
|
|||
|
|
|||
|
**Unicode** (Wikipedia)
|
|||
|
<https://de.wikipedia.org/wiki/Unicode>
|
|||
|
|
|||
|
**UTF-8** (Wikipedia)
|
|||
|
<https://de.wikipedia.org/wiki/UTF-8>
|
|||
|
vorher UCS-2, UTF-16, UTF-32
|
|||
|
|
|||
|
*Musik*
|
|||
|
|
|||
|
**Technical Reports/Annexes**
|
|||
|
<https://www.unicode.org/reports/index.html>
|
|||
|
|
|||
|
\* Normalisierung
|
|||
|
\* Textsegmentierung (Wörter, Zeilen, Absätze)
|
|||
|
\* Collation (Textsortierung)
|
|||
|
|
|||
|
**Herausforderungen beim Rendering**
|
|||
|
\* bidirektionales Textlayout
|
|||
|
\* Ligaturen, Glyphenwahl
|
|||
|
\* Graphem-Cluster
|
|||
|
\* Font-Auswahl
|
|||
|
\* Emoji: <https://unicode.org/emoji/proposals.html>
|
|||
|
|
|||
|
List of Unicode characters (Wikipedia)
|
|||
|
<https://en.wikipedia.org/wiki/List_of_Unicode_characters>
|
|||
|
Search for character(s) in Unicode 10.0.0
|
|||
|
<https://unicode-search.net/>
|
|||
|
|
|||
|
### Sicherheitslücken und Bugs auf Grund von Textencoding
|
|||
|
|
|||
|
Apple Shutdown wenn xy in Nachricht
|
|||
|
effective. Power لُلُصّبُلُلصّبُررً ॣ ॣh ॣ ॣ 冗
|
|||
|
|
|||
|
WhatsApp -\> Schwarzer Punkt -\>
|
|||
|
<https://bgr.com/2018/05/07/whatsapp-emoji-crashes-app-android-fix/>
|
|||
|
|
|||
|
**Mojibake** (文字化け; IPA: \[mod͡ʑibake\]) is the garbled text that is
|
|||
|
the result of text being decoded using an unintended character
|
|||
|
encoding.\[1\] The result is a systematic replacement of symbols with
|
|||
|
completely unrelated ones, often from a different writing system.
|
|||
|
|
|||
|
Rechts nach Links Unicode 202e
|
|||
|
|
|||
|
big list of naughty strings:
|
|||
|
<https://github.com/minimaxir/big-list-of-naughty-strings>
|
|||
|
<https://gojko.net/2017/11/07/five-things-about-unicode.html>
|
|||
|
relevant XKCD <https://xkcd.com/1137/>
|
|||
|
|
|||
|
<https://www.joelonsoftware.com/2003/10/08/the-absolute-minimum-every-software-developer-absolutely-positively-must-know-about-unicode-and-character-sets-no-excuses/>
|
|||
|
|
|||
|
0000 0000 as end of text
|
|||
|
|
|||
|
mysql utf8 types utf8mb4 (four bytes)
|
|||
|
|
|||
|
*Musik*
|
|||
|
|