Zdar, tak bych to trochu upřesnil (neakademicky, prakticky):
1) korelace není výpočet, ale míra, a sice (v tvém případě) LINEÁRNÍ závislosti mezi dvěma veličinami.
2) korelace je česky kladná (>0) a záporná (
A = [--1, -0.5, 0, 0.5, 1]
B = [1, 0.25, 0, 0.25, 1]
(neboli A = B*B). Tady jsou data závislá, dokonce absolutně, ale korelační koef. vyjde stejně 0.
3) ten příklad s kluky a holkami je úplně zcestný. To bys těm klukům musel dát nějaká čísla, holkám totéž, a pak je seřadit podle těch čísel a určit, jestli jsi měl nějakou závislost ve výběru. Jinak totiž můžeš prohodit dva kluky mezi sebou, korelace se změní, ale znamená to u těch kluků něco? Vůbec nic. Dokud nemáš uspořádání, tak prostě můžeš prohazovat, aniž by to cokoliv znamenalo. Proto má smysl počítat korelace třeba na časových řadách (kurzy apod.), ale počítat to na neuspořádaných množinách smysl nedává vůbec žádný.
A takhle by se dalo pokračovat...