ASCII codes
Lo standard più usato per rappresentare i caratteri base dell'alfabeto latino è l'ASCII (pronuncia IPA: æski, proncia traslitterata in italiano: askii). ASCII è l'acronimo di American Standard Code for Information Interchange. Come dice il nome, è uno standard americano quindi è pensato soprattutto per la lingua inglese, che non prevede lettere con l'accento.
Per altri dettagli vedete pagg. 58-59 del vostro libro di testo.
I caratteri non stampabili
I primi 32 caratteri sono detti caratteri di controllo, non sono stampabili e servono per vari scopi, come ad esempio per codificare i tasti freccia (su, giù, destra, sinistra), il tasto per cancellare (canc,del), e così via.
A noi interessano soprattutto i seguenti:
Bit | Decimale | Codice | Descrizione |
---|---|---|---|
0000 | 0 | NUL | "nessun carattere", ha vari usi in informatica |
.... | .. | .. | ..... |
0110 | 10 | LF | "Line Feed", per andare a capo |
0111 | 10 | CR | "Carriage Return", altro carattere per andare a capo |
.... | .. | .. | ..... |
Perché ci sono due caratteri per andare a capo? Questo deriva direttamente dagli antenati diretti dei computer e delle tastiere, le macchine da scrivere meccaniche e successivamente le "teletypewriter"(abbreviato "tty", sigla che ritroverete fra qualche anno...). In queste macchine infatti, per "andare a capo" bisognava effettuare due operazioni distinte tra loro: far scorrere la pagina in basso di una riga (line feed) e far tornare il carrello nella posizione più a sinistra della pagina.
Quando si sono cominciati ad usare i monitor e non la carta, la distinzione non aveva più molto senso. Alcune aziende, come ad esempio Microsoft, hanno deciso di mantenere entrambi i caratteri, quindi per andare a capo in un file alla fine di ogni riga bisogna aggiungere CR+LF. Altri, come ad esempio Unix e derivati (inclusi Linux e macOS) hanno invece semplificato ed ottimizzato utilizzando un solo carattere, LF. È importante sapere queste cose perché quando modificate un file di testo di un programma, potrebbe avere un fine riga diverso da quello che vi aspettate e avere dei problemi. Nella maggior parte degli editor di testo oggi viene specificato nella barra in basso.
Attenzione: questo discorso non vale per documenti creati con elaboratori di testo come Microsoft Word, perché in questo caso il file non è semplicemente l'insieme dei caratteri che genera il testo ma contiene molte più informazioni, come la formattazione, l'impaginazione, etc.
I caratteri stampabili
L'ASCII base prevede 95 caratteri, che comprendono:
- 26 lettere minuscole (a..z)
- 26 lettere maiuscole (A..Z)
- 10 numeri (0..9)
- 32 caratteri di punteggiatura
I caratteri di punteggiatura nell'ambito informatico vengono usati per gli scopi più diversi e spesso sono chiamati con un nome diverso nello slang (dialetto) dei programmatori.
Carattere | Nome ufficiale italiano | Nome ufficiale inglese | Dialetto informatico |
---|---|---|---|
spazio | space | ||
! | punto esclamativo | exclamation mark | bang |
" | doppio apice | double quote | |
# | cancelletto | hash | sharp |
$ | dollaro | dollar | |
% | percento | percent | |
& | e commerciale | ampersand | |
' | apice singolo | single quote | |
( ) | parentesi tonde | round bracket | |
* | asterisco | asterisk | star |
+ | più | plus | |
, | virgola | comma | |
- | meno o trattino | minus or dash | |
. | punto | full stop | dot |
/ | barra | slash | |
: | due punti | colon | |
; | punto e virgola | semicolon | |
< > | minore / maggiore o parentesi angolari (o angolate) | less-than / more than | angle bracket |
= | uguale | equal | |
/ | barra | slash | |
? | punto interrogativo | question mark | |
@ | chiocciola | at | |
^ | accento circonflesso | circumflex | caret |
[ ] | parentesi quadre | square bracket | |
\ | barra rovesciata | backslash | |
_ | trattino basso | underscore | |
` | accento grave | grave accent | backtick (o backquote) |
{ } | parentesi graffe | curly brackets | |
| | barra verticale | vertical bar | pipe (tubo) |
~ | tilde | tilde |