Introducere în STL

Introducere

Până acum, programele pe care le-ați scris, deși sunt corecte și compilează în limbajul C++, respectă în mare parte din cazuri sintaxa din C, exemple fiind tablourile, anumite funcții de sistem și în general, modul în care am lucrat cu variabilele și tipurile de date menționate anterior, cu o singură excepție - citirea și afișarea, care s-au făcut conform limbajului C++.

Cu alte cuvinte, putem spune că programele scrise sunt programe de C care au cin și cout. Astfel, pentru a putea folosi limbajul C++ la adevărata sa valoare, se impune folosirea structurilor de date și celorlalte facilități ale acestui limbaj. O mare parte dintre ele sunt înglobate în ceea ce vom numi STL (Standard Template Library) și ne vor ajuta să lucrăm cu foarte multe tipuri de valori într-un mod dinamic, astfel evitând marea majoritate a neajunsurilor lucrului cu structuri din C, chiar și adaptate la limbajul C++.

În acest articol, ne vom concentra pe cele mai folosite facilități, împreună cu modul în care le putem folosi în probleme.

Structuri de date de tip tablou

În această secțiune, ne vom concentra pe structurile de date care pot fi reprezentate în sintaxa din C sub formă de tablouri. Fie că e vorba de vectori, cozi, stive sau tipuri de date mai complexe, toate acestea vor fi menționate în cele ce urmează.

Deși acest articol poate fi parcurs fără cunoștințe anterioare, se recomandă parcurgerea articolului anterior despre vectori.

Structura std::vector

Aceasta este cea mai simplă structură de date din STL, fiind un tablou cu lungime dinamică, care este indexat de la 0. Pentru a putea folosi această structură de date, va trebui să includem biblioteca <vector>.

Sintaxa unui vector va fi de tipul vector<tip> nume;, unde tip poate fi orice tip de date cunoscut, inclusiv cele pe care le veți studia în acest articol. Cel mai frecvent, veți folosi un vector drept un înlocuitor pentru tablourile de tip array cu care sunteți obișnuiți din codurile scrise anterior.

Mai jos, puteți vedea diverse exemple de folosire a acestei structuri de date în limbajul C++.

Declarările vectorilor

În ceea ce privește declarările, avem o flexibilitate unică pentru limbajul C++, putând declara și atribui vectorul în foarte moduri, așa cum vom prezenta mai jos. În mod particular, putem să asignăm și chiar să comparăm vectori, folosind operatorii = și ==.

În general, complexitatea operațiilor descrise aici este liniară raportat la numărul de valori cu care se lucrează.

Observație

Pentru a compara doi vectori, va trebui să aibă aceeași dimensiune și tip de date, iar dacă acest lucru este adevărat, trebuie să aibă toate valorile egale pe aceeași poziție. În mod similar, atribuirea se va face curățând eventual pozițiile în plus existente și adăugând poziții noi dacă e nevoie.

--8 < --"cppintro/stl/stl01.cpp"

Pentru a declara tablouri bidimensionale, sau chiar tablouri multidimensionale, putem folosi aceeași logică, deoarece acestea sunt vectori de vectori. Aceste tipuri de structuri vor fi folosite și ulterior, în ceea ce privește implementările unor modele matematice sau a unor structuri de date mai complexe despre care veți învăța după ce prindeți mai multă experiență.

--8 < --"cppintro/stl/stl02.cpp"

Inserări, ștergeri și alte ajustări

Pe lângă declarări, atribuiri și comparări, putem și să ajustăm vectorii, folosind foarte multe tipuri de operații care adaugă și scot valori sau chiar fac inserări în diverse poziții, fără a mai fi nevoie de implementarea manuală a operațiilor. Totuși, se remarcă faptul că operațiile de insert și erase vor fi liniare, exact cum sunt și pe tablourile statice.

Iteratori

Valori precum v.begin(), v.end() se numesc iteratori, aceștia vor fi prezentați ulterior. Aceștia reprezintă adresa de memorie de la început și de sfârșit din vector.

--8 < --"cppintro/stl/stl03.cpp"

Afișări în vector

Pentru a afișa diverse valori din vector, vom putea proceda la fel ca în cazul tablourilor din C. Se remarcă folosirea funcției size pentru a afla dimensiunea vectorului, această funcție fiind de tip unsigned, lucru ce necesită prelucrarea cu atenție a acestor valori.

În mod particular, se remarcă folosirea tipului de date auto, care este folosit pentru a evita o declarare specifică a unei variabile, fiind folosit în acest caz pentru a parcurge valorile din vectorul vals.

Tipuri unsigned

Dacă vrem să avem un loop care va rula de v.size() - 3 ori, vom avea de-a face cu un loop infinit în cazul în care v.size() < 3, deoarece rezultatul expresiei va fi si el unsigned, rezultatul dând underflow. Pentru a evita asta, putem fie să rescriem expresiile pentru a conține adunări, fie prin a folosi indicatorul (int) pentru a schimba tipul de date la int, care este un tip de date signed.

--8 < --"cppintro/stl/stl04.cpp"

Structura std::array

Această structură de date este folosită mai rar, dar poate fi utilă în cazul în care vrem să lucrăm cu un array care are avantajele array-urilor din C, dar fără majoritatea dezavantajelor acestora.

Sintaxa unui array va fi de tipul array<tip, dimensiune> nume;. De regulă, nu există diferențe semnificative de performanță între std::vector și std::array, deci în aproape toate cazurile, putem folosi std::vector fără probleme, funcțiile pe care std::array le are sunt incluse în funcțiile vectorului.

--8 < --"cppintro/stl/stl05.cpp"

Structura std::string

Această structură de date este echivalentul std::vector pentru șirurile de caractere, remarcându-se prin faptul că spre deosebire de șirurile de caractere din C, funcția de aflare a lungimii este $\mathcal{O}(1)$ , în loc de $\mathcal{O}(n)$ .

Se recomandă citirea în prealabil a articolului următor despre șiruri de caractere.

De asemenea, toate proprietățile vectorului se aplică și pentru std::string. Pentru a putea folosi această structură de date, va trebui să includem biblioteca <string>. Se remarcă faptul că există anumite diferențe față de cum folosim șirurile de caractere din C.

Sintaxa unui string va fi de tipul string nume;

--8 < --"cppintro/stl/stl06.cpp"

În mod particular, pe lângă funcțiile vectorului, vom putea concatena două șiruri de caractere cu ușurință, folosind operatorul +. Totuși, trebuie să fim atenți cum folosim acest operator, pentru a evita efectuarea prea înceată a operațiilor.

--8 < --"cppintro/stl/stl07.cpp"

Deși în cazul numerelor naturale, aceste operații sunt echivalente, în cazul stringurilor, += și + sunt complet diferite. Prima dintre ele concatenează șirul primit la șirul existent, cea de-a doua copiază cele două șiruri, le unește și apoi atribuie rezultatul șirului. Această diferență devine mai dramatică în situații precum cea de mai jos.

--8 < --"cppintro/stl/stl08.cpp"

Structura std::pair

Această structură de date vă permite să folosiți o combinație de tipuri de date mai complexe, în mod similar cu tipul de date struct pe care l-ați învățat anterior. Un mare avantaj pe care std::pair (și ulterior, std::tuple) îl au este acela că permit instrucțiunilor de sortare să compare două instanțe ale acestui tip de date fără a mai fi nevoie să scriem o funcție suplimentară de comparare a valorilor.

Sintaxa este pair<tip1, tip2> nume;, unde tip1 și tip2 sunt tipuri de date, care pot fi de toate felurile, inclusiv alte perechi. Pentru a putea accesa tip1, respectiv tip2, va trebui să folosim comenzile nume.first și nume.second. Inițializarea unui pair se poate face similar cu cea a unui vector.

În cazul elementelor de tip pair compuse, în mod similar cu struct, notațiile vor fi la fel compuse.

De exemplu, dacă avem pair<pair<int, int>, pair<int, int>> p = {{2, 4}, {1, 3}};, cele patru elemente vor putea fi declarate și accesate după cum urmează:

--8 < --"cppintro/stl/stl09.cpp"

Structura std::tuple

Această structură de date reprezintă o generalizare a structurii std::pair vă permite să folosiți o combinație de tipuri de date mai complexe, într-o manieră mult mai ușoară decât ați face-o dacă ați folosi pair sau vector, profitând de avantajul că putem ține tipuri de date diferite în fiecare dintre poziții. Pentru a folosi tuple, va trebui să includeți <tuple>.

Chiar dacă putem ține valori multiple folosind pair-uri imbricate, tuplurile vor face acest lucru mult mai ușor.

tuple<tip1, tip2, ..., tipN> t: Creăm un tuplu cu $N$ valori, a $i$ -a valoare având $tip\_i$ .
make_tuple(a, b, c, ..., d): Returnează un tuplu cu valorile scrise în paranteză
tie(a, b, c, ..., d) = t: Setăm $a, b, c, \dots, d$ la valorile din tuplul $t$ în ordinea dată.
get<i>(t): Returnează cea de-a $i$ -a valoare din tuplul $t$ . Putem folosi această sintaxă și pentru a schimba valoarea din $t$ .

Această operație merge doar dacă $i$ este o constantă, nu putem schimba valorile dacă $i$ nu este o constantă.

--8 < --"cppintro/stl/stl10.cpp"

Mai jos puteți găsi un exemplu de folosire a acestor instrucțiuni.

--8 < --"cppintro/stl/stl11.cpp"

Iteratori

Iteratorii sunt structuri care pot fi utilizate să identifice și traverseze elementele unui container STL. Ei sunt implementați numai la structurile cu acces aleatoriu (toate mai puțin queue, stack și priority_queue).

Glosar iteratori

range reprezintă un interval de elemente de tip [start, end).
iterator de început: iterator care marchează începutul unui range.
iterator past-the-end: iterator care marchează finalul unui range. Deși uneori poate fi accesat, în cele mai multe cazuri accesarea lui duce la erori (de exemplu, rezultatul pentru .end()).

Cum obțin un iterator?

.begin() - iterator la primul element din structură;
.end() - iterator past-the-end pentru structură;
.rbegin() - iterator invers la ultimul element din structură;
.rend() - iterator invers past-the-beginning pentru structură.

Ce pot face cu un iterator?

Să parcurgi structura
- Fiecare iterator permite să îl incrementezi (++it) să se ducă mai departe.
- Putem folosi și it++, dar de obicei este mai lent.
Să îl pui drept parametru la o funcție
- Multe funcții din <algorithm> care merg pe range-uri cer un iterator de început și un iterator "past-the-end".
  - De exemplu, funcția sort() cere doi iteratori: unul care marchează începutul și elementul de după sfârșit (cum ar fi begin() și end()).
- Structurile std::vector și std::deque oferă și funcțiile .erase() și .insert()
  - Funcția .insert() adaugă un element înaintea elementului iteratorului.
  - Funcția .erase() poate primi un singur argument, elementul care să fie șters, sau două argumente, range-ul pe care să îl șteargă.
Foarte multe funcții returnează iteratori, exemple fiind funcțiile lower_bound() și upper_bound() din diverse structuri de date precum std::set, std::map.

Structuri de date liniare

Observație

Toate aceste structuri de date au în spatele implementării lor din STL o structură de tip deque.

Structura std::queue

În general, folosim această structură de date pentru a simula funcționalitățile unei cozi. Pentru a folosi std::queue, avem nevoie de biblioteca <queue>.

Deși pentru mai multe detalii, puteți accesa articolul nostru despre cozi, mai jos puteți găsi un exemplu de folosire a acestor instrucțiuni.

--8 < --"cppintro/stl/stl12.cpp"

Structura std::stack

În general, folosim această structură de date pentru a simula funcționalitățile unei stive. Pentru a folosi std::stack, avem nevoie de biblioteca <stack>.

Deși pentru mai multe detalii, puteți accesa articolul nostru despre stive, mai jos puteți găsi un exemplu de folosire a acestor instrucțiuni.

--8 < --"cppintro/stl/stl13.cpp"

Structura std::deque

În general, folosim această structură de date pentru a simula funcționalitățile unui deque. Pentru a folosi std::deque, avem nevoie de biblioteca <deque>.

Deși pentru mai multe detalii, puteți accesa articolul nostru despre deques, mai jos puteți găsi un exemplu de folosire a acestor instrucțiuni.

Accesarea pozițiilor oarecare

Spre deosebire de stack și queue, deque permite accesarea pozițiilor oarecare, la fel ca la vector. În multe contexte, putem spune că deque este un vector mai complex, cu toate că un dezavantaj ar fi viteza un pic mai redusă a instrucțiunilor la deque spre deosebire de vector.

--8 < --"cppintro/stl/stl14.cpp"

Structuri de date arborescente

Structurile de date arborescente ne permit să putem lucra cu valori ordonate în mod dinamic, având o performanță foarte bună, complexitatea operațiilor fiind în cele mai multe cazuri logaritimică, deoarece se bazează pe diverși arbori binari care permit sortări dintre cele mai rapide.

Structura std::map

Un map este o structură de date arborescentă care ne permite să păstrăm pentru fiecare cheie o valoare specifică, fiind foarte similar ca principiu cu funcțiile de la matematică. Pentru a putea folosi std::map, va trebui să includem biblioteca <map>. Sintaxa acestuia va fi map <tip1, tip2> nume, iar tipurile de date vor putea fi cele cunoscute, inclusiv vectori și stringuri. Cheile vor fi ordonate crescător, datorită implementării bazate pe red-black trees.

Dintre cele mai importante funcții, vom enumera următoarele:

Atribuirea: mp[x] = y; face valoarea cheii $x$ să devină $y$ . În mod particular, dacă încercăm să lucrăm cu o cheie $x\_1$ neinițializată, ea va fi inițializată cu 0, așa cum se va putea vedea în codul de mai jos.
Găsirea unui element: mp.find(x) != mp.end() verifică dacă $x$ există în map, fără a crea un element nou în map.
Ștergerea: mp.erase(x) șterge instanța cheii $x$ din map. Dacă $x$ nu se află în map, nu se întâmplă nimic.
Curățarea: mp.clear() șterge toate cheile din map.
Lower_bound: mp.lower_bound(x) returnează un iterator care ține cea mai mică valoare mai mare sau egală cu valoarea $x$ sau mp.end() dacă nu avem o asemenea valoare.
Upper_bound: mp.upper_bound(x) returnează un iterator care ține cea mai mică valoare strict mai mare decât valoarea $x$ sau mp.end() dacă nu avem o asemenea valoare.
Afișarea valorilor se poate face în două moduri, fie cu iteratori specifici, fie cu tipul auto.

Cea mai simplă utilizare a unui map va fi drept un vector de frecvență dinamic, deoarece vom putea stoca valori oricât de mari într-o complexitate logaritmică per operație. Mai jos găsiți exemple de utilizare a map-ului.

--8 < --"cppintro/stl/stl15.cpp"

Structura std::set

Un set este o structură de date arborescentă care ne permite să păstrăm o listă de valori care apare, ordonată crescător, fiind foarte similar ca principiu cu mulțimile de la matematică. Pentru a putea folosi std::set, va trebui să includem biblioteca <set>. Sintaxa acestuia va fi set <tip> nume, iar tipurile de date vor putea fi cele cunoscute, inclusiv vectori și stringuri.

Dintre cele mai importante funcții, vom enumera următoarele:

Inserarea: s.insert(x) adaugă $x$ în setul $s$ . În mod particular, dacă încercăm să inserăm o valoare care deja este în set, nu se va întâmpla nimic.
Găsirea unui element: La fel ca la map, s.find(x) != s.end() verifică dacă $x$ există în set, fără a crea un element nou în set.
Ștergerea: s.erase(x) șterge $x$ din set. Dacă $x$ nu se află în set, nu se întâmplă nimic.
Curățarea: s.clear() șterge toate cheile din set.
Lower_bound: s.lower_bound(x) returnează un iterator care ține cea mai mică valoare mai mare sau egală cu valoarea $x$ sau s.end() dacă nu avem o asemenea valoare.
Upper_bound: s.upper_bound(x) returnează un iterator care ține cea mai mică valoare strict mai mare decât valoarea $x$ sau s.end() dacă nu avem o asemenea valoare.
Afișarea valorilor se poate face în două moduri, fie cu iteratori specifici, fie cu tipul auto.

Cea mai simplă utilizare a unui set va fi drept o mulțime dinamică, deoarece vom putea stoca valori oricât de mari într-o complexitate logaritmică per operație. Mai jos găsiți exemple de utilizare a setului. Totuși, nu vom putea păstra informații mai avansate, precum poziția relativă, acestea fiind discutate ulterior în articol, când vorbim despre policy based data structures.

--8 < --"cppintro/stl/stl16.cpp"

std::unordered_map și std::unordered_set

Atât std::set cât și std::map au versiuni unordered ale acestora, care acționează în mod similar cu structuri de tip hashmap, codificând valorile sub diverse forme pentru a evita coliziuni de diverse moduri. Totuși, aici nu vom discuta teoria din spatele hashurilor, ci doar containerele în sine articolul nostru despre hashing. Deși funcțiile pe care cele două structuri de date le au sunt identice cu cele ale echivalentelor lor sortate, uneori pot deveni foarte utile în concursuri.

std::unordered_map este versiunea nesortată a map-ului, fiind inclus în biblioteca <unordered_map>. Sintaxa acestuia va fi unordered_map <tip1, tip2> nume.

std::unordered_set este versiunea nesortată a set-ului, fiind inclus în biblioteca <unordered_set>. Sintaxa acestuia va fi unordered_set <tip> nume.

Complexitatea operațiilor descrise la map, respectiv set pentru cele două structuri este în medie $\mathcal{O}(1)$ amortizat, dar în cel mai rău caz, complexitatea finală este $\mathcal{O}(n)$ per operație, unde $n$ este dimensiunea structurii de date în cauză. Totuși, așa cum este explicat și în articolul despre hashing, această problemă poate fi rezolvată folosind un hash custom, dar constanta devine în multe cazuri suficient de slabă încât să nu mai fie optimă folosirea structurilor de tip unordered.

std::multimap și std::multiset

De asemenea, std::set și std::map au și versiuni care ne permit să ținem mai multe instanțe ale aceleiași valori, std::multiset fiind de departe cel mai utilizat în practică. Acestea au aceleași funcții specifice cu cele întâlnite la set și map, dar trebuie să fim atenți la un aspect foarte important, sintaxa fiind la fel (multiset <tip> nume).

Erase și multiseturile

Dacă folosim erase în același mod cum am explicat la set, toate valorile egale cu $x$ se șterg, deci trebuie să folosim ms.erase(ms.find(val)).

ms.erase(x) - șterge toate aparițiile lui $x$ din multiset.
ms.erase(ms.find(x)) - șterge o singură apariție a lui $x$ din multiset.

La fel ca la set și map, complexitatea operațiilor este logaritimică, cu o singură excepție, aceasta fiind funcția count, care numără valorile egale cu x. Totuși, complexitatea lui count este liniară, fapt pentru care nu se recomandă folosirea acestei funcții.

Structura std::priority_queue

O coadă de priorități este o coadă pe care o folosim pentru a păstra datele într-o ordine dată (by default, descrescătoare). Implementarea ei este bazată pe o structură de date de tip heap, permițând operații de push, pop și top, în mod similar cu cele de la coadă, cu diferența că valorile sunt ținute ordonat. Complexitatea operațiilor este $\mathcal{O}(\log n)$ . Chiar dacă această structură de date este un pic mai rapidă decât set și map, un mare dezavantaj este dat de faptul că doar elementul din vârf poate fi accesat, în mod similar cu funcționalitatea heap-ului.

În general, vom vrea să folosim o coadă de priorități atunci când vrem să aflăm mai rapid cel mai mare sau cel mai mic element, constanta fiind bună, fapt ce face această structură de date principala metodă de a implementa diverși algoritmi de tip greedy mai complicați, cel mai cunoscut fiind algoritmul lui Dijkstra pe grafuri cu costuri.

Pentru a folosi această structură de date, biblioteca <queue> este necesară. Sintaxa unei cozi de priorități este priority_queue<tip> nume. Mai jos găsiți un exemplu de implementare a acestei structuri de date.

--8 < --"cppintro/stl/stl17.cpp"

Accesarea valorilor în ordine crescătoare

Pentru a accesa valorile în ordine crescătoare, avem două opțiuni: Fie le adăugăm cu semn schimbat, fără a schimba sintaxa structurii de date, fie adăugăm un comparator custom. Mai jos aveți sintaxa cu comparator custom.

--8 < --"cppintro/stl/stl18.cpp"

Policy based data structures

Structurile de date menționate anterior, deși puternice, nu ne permit să răspundem la întrebări de tipul:

Care este a $k$ -a valoare în ordine crescătoare prezentă în set/map?
Câte valori sunt mai mici decât $x$ în set/map?

Deși aceste întrebări pot fi rezolvate folosind structuri de date complexe, precum arborii de intervale dinamici sau eventual folosind normalizări dificil de implementat, există o opțiune inbuilt destul de ușor de folosit și destul de rapidă, complexitatea operațiilor fiind $\mathcal{O}(\log n)$ , la fel ca la set și map.

Atenție la constante

Totuși, se remarcă faptul că constanta este una foarte mare, fiind mult mai înceată decât alte metode care ar fi mai greu de implementat.

Această structură de date ne va permite să folosim facilitățile setului, împreună cu două funcții noi:

find_by_order(k) - Al $k$ -lea cel mai mare element, începând de la 0.
order_of_key(x) - Numărul de valori strict mai mici decât $x$ .

Pentru a putea folosi această structură de date, trebuie să declarăm următoarele biblioteci, namespace-uri și typedefs:

--8 < --"cppintro/stl/stl19.cpp"

Alte tipuri de date

Pentru a folosi policy based data structures și cu alte tipuri de date, trebuie înlocuite cele două int-uri cu tipul de date potrivit. De exemplu,

--8 < --"cppintro/stl/stl20.cpp"

ne permite să ținem pair-uri și să operăm în mod similar, fiind foarte util atunci când vrem să lucrăm cu duplicate și eventual să stocăm valori mai complexe.

Mai jos găsiți un exemplu de folosire a acestei structuri de date, așa cum a fost folosită în problema AIB de pe pbinfo.

--8 < --"cppintro/stl/stl21.cpp"

Pe lângă o mare parte din problemele cu structuri de date, această structură de date poate fi aplicată și pentru a rezolva problema Greetings de pe Codeforces.

Concluzii

Structurile de date din STL sunt unul dintre cele mai importante unelte pe care le puteți folosi în programare și cunoașterea lor este esențială pentru a putea fi programatori cât mai buni. De asemenea, flexibilitatea lor ușurează multe implementări în special în condiții de concurs, unde timpul este limitat.

Totuși, trebuie să aveți în vedere faptul că este de preferat înțelegerea conținuturilor, pentru a evita folosirea lor oricând și oricum, fără a avea în vedere abordările alternative care ar putea exista la probleme, lucru care se remarcă mai ales la structurile de date arborescente, precum std::set și std::map.

Introducere în STL

Introducere

Structuri de date de tip tablou

Structura std::vector

Declarările vectorilor

Inserări, ștergeri și alte ajustări

Afișări în vector

Structura std::array

Structura std::string

Structura std::pair

Structura std::tuple

Iteratori

Glosar iteratori

Cum obțin un iterator?

Ce pot face cu un iterator?

Structuri de date liniare

Structura std::queue

Structura std::stack

Structura std::deque

Structuri de date arborescente

Structura std::map

Structura std::set

std::unordered_map și std::unordered_set

std::multimap și std::multiset

Structura std::priority_queue

Policy based data structures

Concluzii

Resurse suplimentare

On this page