CapesNSI2021/2021_epreuve_1.ipynb

2068 lines
110 KiB
Plaintext
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{
"cells": [
{
"cell_type": "raw",
"metadata": {},
"source": [
"---\n",
"CAPES NSI 2021\n",
"Épreuve n°1\n",
"date: 22/03/2021\n",
"---"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Cette épreuve est constituée de deux problèmes indépendants."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Pour ce sujet, **le langage de programmation utilisé sera Python**. Vous pourrez utiliser les fonctions Python de manipulation de listes ou de matrices suivantes :\n",
"\n",
"* Création dune liste de taille $n$ remplie avec la valeur $x$ : `li = [x] * n`. \n",
"* Obtention de la taille dune liste `li` : `len(li)`.\n",
"* Si `li` est une liste de $n$ éléments, on peut accéder au $k^e$ élément (pour $0\\leq k < \\mathtt{len(li)}$) avec `li[k]`. On peut définir sa valeur avec `li[k] = x`.\n",
"* Un élément $x$ peut être ajouté dans une liste `li` à laide de `li.append(x)`. On considèrera quil sagit dune opération élémentaire.\n",
"* Les matrices sont des listes de listes, chaque sous-liste étant considérée comme une ligne de la matrice. Si `mat` est une matrice, elle possède `len(mat)` lignes et `len(mat[0])` colonnes.\n",
"* Création dune matrice de $n$ lignes et $p$ colonnes, dont toutes les cases contiennent $x$ : `mat = [[x for j in range(p)] for i in range(n)]`.\n",
"* On accède à (resp. modifie) lélément de `mat` dans la $i^e$ ligne et $j^e$ colonne avec `mat[i][j]` (resp. `mat[i][j] = x`).\n",
"\n",
"À moins de les redéfinir explicitement, lutilisation de toute autre fonction sur les listes (`sort`, `index`, `max`, etc.) est interdite. On rappelle enfin quune fonction qui sarrête sans avoir rencontré linstruction `return`renvoie `None`."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Problème 1 : Points proches dans le plan"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Ce problème, pouvant par exemple survenir dans le domaine de la navigation maritime, vise à détermi-ner, dans un nuage de points du plan, la paire de points les plus proches. Il est constitué de trois parties dépendantes."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Formellement, on suppose qu'on dispose de $n$ points dans le plan ($M_0$, $M_1$, ..., $M_{n-1}$) dans un ordre quelconque pour le moment. Ils seront représentés en Python par deux listes de flottants de taille $n$ : `coords_x` et `coords_y`, donnant respectivement les abscisses et les ordonnées des points. On dira ainsi que $M_i$ est le point d'indice $i$, qu'il a pour abscisse $x_i =$ `coords_x[i]` et pour ordonnée $y_i=$`coords_y[i]`. On supposera que `coords_x` et `coords_y` sont des variables globales, qu'on ne modifiera jamais au cours de l'exécution de lalgorithme."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"hors_enonce"
]
},
"source": [
"Exemple de nuage de points aléatoires"
]
},
{
"cell_type": "code",
"execution_count": 1,
"metadata": {
"tags": [
"hors_enonce"
]
},
"outputs": [],
"source": [
"from random import random\n",
"n = 32\n",
"coords_x = [random() for _ in range(n)]\n",
"coords_y = [random() for _ in range(n)]"
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {
"tags": [
"hors_enonce"
]
},
"outputs": [
{
"data": {
"image/png": "iVBORw0KGgoAAAANSUhEUgAAAXQAAAD4CAYAAAD8Zh1EAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjMuMCwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy86wFpkAAAACXBIWXMAAAsTAAALEwEAmpwYAAASqUlEQVR4nO3dXYxk513n8e8vY2YjIC+wM0CwPRmjHUuMAkuilkkDIo3GrMa+sJHCsrbIElZWRsAaIYGQjEJCZF+MAoILhHdhlI0CkYgxES8jZSKz8bplKbTNtJXgxBPZGcyLx8niIRjfRMGx+XNxqk3Rqe4603266vSp70ca1ak6j7r+fWrqV08/56nnpKqQJO1/r5p3AZKkbhjokjQQBrokDYSBLkkDYaBL0kBcNa8nPnToUB09enReTy9J+9Jjjz32D1V1eNK+uQX60aNHWV9fn9fTS9K+lORvt9o3dcglyQeTPJfks1vsT5LfTHIxyeNJ3rKbYiVJO9NmDP1DwMlt9t8EHBv9OwX8792XJUm6UlMDvaoeBv5xmya3Ar9XjUeA1yd5Q1cFSpLa6WKWy9XAM2P3L40e+xpJTiVZT7J++fLlDp5akrRhptMWq+pMVS1V1dLhwxNP0kqSdqiLQH8WuHbs/jWjxyRJM9RFoJ8FfmI02+WtwAtV9cUOfq40fGtrcPp0cyvt0tR56Ek+AqwAh5JcAn4F+DqAqvpt4BxwM3AR+DLwP/aqWE2xtgarq7CyAsvL865G06ytwYkT8OKLcPAgPPigr5t2ZWqgV9XtU/YX8D87q0g7YzjsP6urzev18svN7eqqr5l2xbVchmJSOKjfVlaaD98DB5rblZV5V6R9bm5f/VfHNsJho4duOPTf8nLzl5TDZOqIgT4UhsP+tLzsa6XOGOhDYjjMniei1SMGurRTnohWz3hSVNopT0SrZwx0aaecpaKecchF2ilPRKtnDHRpNzwRrR5xyEWSBsJAl6SBMNDVX21XInTFQglwDF191XaOt3PBpVfYQ1c/tZ3j7Vxw6RUGuvqp7Rxv54JLr3DIRf3Udo73LOaCL8J6LYvwOy6ANNenmL2lpaVaX1+fy3NLrS3CGP0i/I4DkuSxqlqatM8hF2k7izBGvwi/44Iw0KXtLMIY/SL8jgvCMXRpO4uwXssi/I4LwjF0SdpHHEOXpAVgoEvSQBjokjQQBrokDYSBLkkDYaBL0kAY6JI0EAa6JA2EgS5p57xaVK/41X/tDZdjHT5XaewdA13d842+GCat0rjT19kOQCdaDbkkOZnkySQXk9w1Yf+RJA8l+VSSx5Pc3H2p2jdcjnUxdLVK40YH4D3vaW4dvtmxqYGe5ABwL3ATcBy4PcnxTc1+Gbi/qt4M3Ab8r64L1T7icqyLYWOVxnvu2d1fYXYAOtNmyOUG4GJVPQ2Q5D7gVuDCWJsCXjvafh3whS6L1D7jcqyLY3l596/vRgdgY4jODsCOtQn0q4Fnxu5fAr53U5v3AX+W5GeBbwBunPSDkpwCTgEcOXLkSmvVftLFG12LwQ5AZ7o6KXo78KGq+vUky8CHk7ypqv5lvFFVnQHOQLMeekfPLWm/swPQiTYnRZ8Frh27f83osXF3APcDVNUa8GrgUBcFSpLaaRPo54FjSa5LcpDmpOfZTW3+DjgBkOQ7aQL9cpeFSpK2NzXQq+ol4E7gAeBzNLNZnkhyd5JbRs1+AXhXkr8EPgL8ZM3r2naStKBajaFX1Tng3KbH3ju2fQH4/m5LkyRdCddykaSBMNAlaSAMdEkaCANdkgbCQJekgTDQpaHy4hMLx/XQpSFyTfqFZA9dGiKXpF1IBro0RK5Jv5AccpGGyCVpF5KBLg2VS9IuHIdcJGkgDHRJ/eOUyx1xyEVSvzjlcsfsoUvqF6dc7piBLqlfnHK5Yw65SOoXp1zumIEuqX+ccrkjDrlI0kAY6JI0EAa6JA2EgS5JA2GgS9JAGOiSNBAGuiQNhIEuSQNhoEvSQBjoUpdc9lVz5Ff/pa647KvmzB661BWXfdWcGehSV1z2VXPWKtCTnEzyZJKLSe7aos2PJbmQ5Ikkv99tmdI+sLHs6z33ONyiuZg6hp7kAHAv8MPAJeB8krNVdWGszTHgl4Dvr6rnk3zLXhUs9ZrLvmqO2vTQbwAuVtXTVfUicB9w66Y27wLurarnAarquW7LlCRN0ybQrwaeGbt/afTYuOuB65N8MskjSU52VaAkqZ2upi1eBRwDVoBrgIeTfFdV/dN4oySngFMAR44c6eiptWNra17my2OgAWkT6M8C147dv2b02LhLwKNV9VXgr5M8RRPw58cbVdUZ4AzA0tJS7bRodcA50x4DDU6bIZfzwLEk1yU5CNwGnN3U5k9oeuckOUQzBPN0d2Wqc86Z9hhocKYGelW9BNwJPAB8Dri/qp5IcneSW0bNHgC+lOQC8BDwi1X1pb0qWh1wzrTHQIOTqvmMfCwtLdX6+vpcnlsjjh97DLTvJHmsqpYm7jPQJWn/2C7Q/eq/JA2EgS5JA2GgS9JAGOiSNBAGuiQNhIEuSQNhoEvSQBjokjQQBrokDYSBrvlaW4PTp5tbSbvS1Xro0pVz+VqpU/bQNT8uXyt1ykAfuj4PafR5+do+HzdpCw65DFnfhzSWl5ua+rZ8bd+Pm7QFA33IJg1p9C2Ylpf7V9N+OG7SBA65DFmfhzT6zOOmfcoe+pD1dUij7zxu2qe8YpEk7SNesUiSFoCBLkkDYaBL0kAY6JI0EAa6JA2EgS5JA2GgS9JAGOiSNBAGuiQNhIEuSQNhoEvSQBjokjQQBrokDUSrQE9yMsmTSS4muWubdm9PUkkmrgQmSdo7UwM9yQHgXuAm4Dhwe5LjE9q9Bvg54NGui5QkTdemh34DcLGqnq6qF4H7gFsntLsHeD/wlQ7rkyS11CbQrwaeGbt/afTYK5K8Bbi2qj623Q9KcirJepL1y5cvX3GxkqSt7fqkaJJXAb8B/MK0tlV1pqqWqmrp8OHDu31qSdKYNoH+LHDt2P1rRo9teA3wJmA1yd8AbwXOemJUkmarTaCfB44luS7JQeA24OzGzqp6oaoOVdXRqjoKPALcUlVeMFSSZmhqoFfVS8CdwAPA54D7q+qJJHcnuWWvC5T2zNoanD7d3EoDcFWbRlV1Dji36bH3btF2ZfdlSXtsbQ1OnIAXX4SDB+HBB2F5ed5VSbviN0W1mFZXmzB/+eXmdnW1259v719z0KqHLg3OykrTM9/ooa+sdPez7f1rTgx0Labl5SZoV1ebMO8ycCf1/g10zYCBrsW1vLw3QbuXvX9pGwa61LW97P1L2zDQpb2wV71/aRvOclH/OWNEasUeuvrNGSNSa/bQ1W9bzRe31y59DXvo6rdJM0bstUsT2UNXv23MGLnnnn8L7r3+lqe0T9lDV/9tnjHiPG9pIgO9T9bWnLvchvO8pYkM9L5wXPjKOM9b+hqOoffFbsaFnfEhCXvo/bHTcWF79pJG7KH3xaTZHG3Mc8aHfxlIvWIPvU92Mi48rxkf/mUg9Y6Bvt/Na8aHa35LvWOgD8E8Znw4F1zqHQNdO+NccKl3DHTtXNd/GfjFKmlXDHT1gydZpV1z2qL6wQW3pF0z0NUPGydZDxzwJKu0Qw65qB88ySrtmoGu/nDBLWlXHHKRpIEw0CVpIAx0SRoIA12SBsJAl6SBaBXoSU4meTLJxSR3Tdj/80kuJHk8yYNJ3th9qZKk7UwN9CQHgHuBm4DjwO1Jjm9q9ilgqaq+G/go8KtdFypJ2l6bHvoNwMWqerqqXgTuA24db1BVD1XVl0d3HwGu6bZMSdI0bQL9auCZsfuXRo9t5Q7g45N2JDmVZD3J+uXLl9tXKUmaqtOTokneASwBvzZpf1Wdqaqlqlo6fPhwl08tSQuvzVf/nwWuHbt/zeixfyfJjcC7gbdV1T93U54kqa02PfTzwLEk1yU5CNwGnB1vkOTNwO8At1TVc92XKUmaZmqgV9VLwJ3AA8DngPur6okkdye5ZdTs14BvBP4wyaeTnN3ix0mS9kir1Rar6hxwbtNj7x3bvrHjuiRJV8hvikrSQBjokjQQBvqQra3B6dPNraTB84pFQ7W2BidONBdcPniwubybVwOSBs0e+lCtrjZh/vLLze3q6rwrkrTHDPShWllpeuYHDjS3KyvzrkjSHnPIZaiWl5thltXVJswdbpEGz0AfsuVlg1xaIA65SNJAGOiSNBAGuiQNhIEuSQNhoEvSQBjokjQQBrokDYSBLkkDYaBL0kAY6JI0EAa6JA2EgS5JA2GgS9JAGOiSNBAGuiQNhIEuSQNhoKs/1tbg9OnmVtIV84pF6oe1NThxormg9cGDzeXzvNqSdEXsoasfVlebMH/55eZ2dXXeFUn7joGuflhZaXrmBw40tysr865I2nccclE/LC83wyyrq02YO9wiXTEDXf2xvLxYQb625geYOmWgS/OwH08C+wHUewb6UPnm67dJJ4H7/Drtxw+gBdTqpGiSk0meTHIxyV0T9v+HJH8w2v9okqOdV6r2Nt5873lPc+u87v7p4iTwLOftOwtpX5jaQ09yALgX+GHgEnA+ydmqujDW7A7g+ar6T0luA94P/Le9KFgt7Lfe3yLa7UngWfeYNz6ANp7PWUi91GbI5QbgYlU9DZDkPuBWYDzQbwXeN9r+KPBbSVJV1WGtass33/6wm5PAs/7QdhbSvtAm0K8Gnhm7fwn43q3aVNVLSV4A/iPwD+ONkpwCTgEcOXJkhyVrKt98wzePD+1Fm4W0D830pGhVnQHOACwtLdl730u++YbND21N0CbQnwWuHbt/zeixSW0uJbkKeB3wpU4qlDSZH9rapM0sl/PAsSTXJTkI3Aac3dTmLPDO0faPAv/P8XNJmq2pPfTRmPidwAPAAeCDVfVEkruB9ao6C/wf4MNJLgL/SBP6kqQZajWGXlXngHObHnvv2PZXgP/abWmSpCvhaouSNBAGuiQNhIEuSQOReU1GSXIZ+NsZPuUhNn3RqYescff6Xh9YY1f6XuNe1ffGqjo8acfcAn3WkqxX1dK869iONe5e3+sDa+xK32ucR30OuUjSQBjokjQQixToZ+ZdQAvWuHt9rw+ssSt9r3Hm9S3MGLokDd0i9dAladAMdEkaiMEGepJvTvJ/k3x+dPtNE9p8T5K1JE8keTzJTC6b1/drtLao7+eTXBgdsweTvHGW9bWpcazd25NUkplPb2tTY5IfGx3LJ5L8ft9qTHIkyUNJPjV6vW+ecX0fTPJcks9usT9JfnNU/+NJ3jLL+lrW+OOj2j6T5M+T/Oc9K6aqBvkP+FXgrtH2XcD7J7S5Hjg22v524IvA6/e4rgPAXwHfARwE/hI4vqnNzwC/Pdq+DfiDGR63NvX9EPD1o+2fnmV9bWsctXsN8DDwCLDUtxqBY8CngG8a3f+WHtZ4Bvjp0fZx4G9mXOMPAm8BPrvF/puBjwMB3go8Osv6Wtb4fWOv8U17WeNge+g01zn93dH27wI/srlBVT1VVZ8fbX8BeA6Y+A2sDr1yjdaqehHYuEbruPHaPwqcSJI9rqt1fVX1UFV9eXT3EZqLnsxSm2MIcA/NBcu/MsviRtrU+C7g3qp6HqCqnuthjQW8drT9OuALM6yPqnqYZknurdwK/F41HgFen+QNs6muMa3GqvrzjdeYPX6/DDnQv7Wqvjja/v/At27XOMkNNL2Uv9rjuiZdo/XqrdpU1UvAxjVaZ6FNfePuoOkhzdLUGkd/el9bVR+bZWFj2hzH64Hrk3wyySNJTs6sukabGt8HvCPJJZoltH92NqW1dqX/X+dtT98vM72maNeSfAL4tgm73j1+p6oqyZbzM0ef6B8G3llV/9JtlcOV5B3AEvC2edcyLsmrgN8AfnLOpUxzFc2wywpNr+3hJN9VVf80z6I2uR34UFX9epJlmgvZvMn3yZVL8kM0gf4De/Uc+zrQq+rGrfYl+fskb6iqL44Ce+Kfs0leC3wMePfoT7a91vdrtLapjyQ30nxwvq2q/nlGtW2YVuNrgDcBq6ORqm8Dzia5parWe1IjNL3JR6vqq8BfJ3mKJuDPz6bEVjXeAZwEqKq1JK+mWXRq1sNDW2n1/3Xeknw38AHgpqras/fykIdcxq9z+k7gTzc3GF0j9Y9pxuA+OqO6+n6N1qn1JXkz8DvALXMY951aY1W9UFWHqupoVR2lGbecZZhPrXHkT2h65yQ5RDME83TPavw74MSoxu8EXg1cnmGN05wFfmI02+WtwAtjQ629kOQI8EfAf6+qp/b0yWZ9RnhW/2jGnB8EPg98Avjm0eNLwAdG2+8Avgp8euzf98ygtpuBp2jG6989euxumtCB5k3zh8BF4C+A75jxsZtW3yeAvx87Zmfn8PpuW+OmtqvMeJZLy+MYmqGhC8BngNt6WONx4JM0M2A+DfyXGdf3EZrZZ1+l+YvmDuCngJ8aO4b3jur/zJxe52k1fgB4fuz9sr5XtfjVf0kaiCEPuUjSQjHQJWkgDHRJGggDXZIGwkCXpIEw0CVpIAx0SRqIfwWBVCV24nXHCAAAAABJRU5ErkJggg==\n",
"text/plain": [
"<Figure size 432x288 with 1 Axes>"
]
},
"metadata": {
"needs_background": "light"
},
"output_type": "display_data"
}
],
"source": [
"from matplotlib import pyplot as plt\n",
"plt.plot(coords_x, coords_y, 'r.')\n",
"plt.axis('equal')\n",
"plt.show()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Approche exhaustive"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On utilise la distance euclidienne définie par $d(M_i, M_j) = \\sqrt{(x_j-x_i)^2+(y_j-y_i)^2}$."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 1** Écrire une fonction `distance(i, j)` qui renvoie la distance entre les points $M_i$\n",
" et $M_j$. On utilisera la fonction `sqrt` après lavoir importée."
]
},
{
"cell_type": "code",
"execution_count": 3,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [],
"source": [
"from math import sqrt\n",
"def distance(i, j):\n",
" return sqrt((coords_x[j] - coords_x[i])**2 + (coords_y[j] - coords_y[i])**2)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 2** Rappeler sommairement comment sont stockés les flottants en mémoire. Quelle conséquence cela peut-il avoir sur le calcul de la distance ? On ignorera par la suite les problèmes dapproximation."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Les flottants permettent de représenter des (approximations de) nombres réels. Cette représentation s'appuie sur le fait qu'étant donné un entier $b>1$, tout nombre réel $x$ non nul peut s'écrire d'une unique façon sous la forme\n",
"$$ x = (-1)^s\\times b^e\\times m,$$\n",
"où\n",
"\n",
"* $s\\in\\{0, 1\\}$ précise le *signe* de $x$ ;\n",
"* $e\\in\\mathbb{Z}$ est un *exposant* donnant l'ordre de grandeur de $x$ dans la base $b$ ;\n",
"* $m\\in[1, b[$ est un réel appelé *mantisse*.\n",
"\n",
"Dans la pratique, par exemple dans la norme IEEE 754, la représentation des flottants se fait sur un nombre fixé de bits divisés en trois parties :\n",
"\n",
"* un bit pour le signe ;\n",
"* quelques bits pour l'exposant ;\n",
"* les bits restant pour la mantisse.\n",
"\n",
"Cette représentation a pour conséquences \n",
"\n",
"1. un nombre fini de réels peuvent être représentés (au maximum $2^n$ réels si $n$ est le nombre total de bits de la représentation) ;\n",
"2. pour la plupart des nombres réels la mantisse ne peut pas être écrite entièrement : il faut la tronquer ;\n",
"3. les opérations arithmétiques élémentaires sur les nombres flottants produisent des résultats mathématiquement faux, mais le plus souvent (heureusement) approximativement corrects."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 3** Écrire une fonction `plus_proche()` qui renvoie, à laide dune recherche exhaustive, le couple d'entiers des indices $i$ et $j$ des deux points les plus proches du nuage de points."
]
},
{
"cell_type": "code",
"execution_count": 4,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [],
"source": [
"def plus_proche():\n",
" dmin = float('inf')\n",
" imin = jmin = -1\n",
" for i in range(n - 1):\n",
" for j in range(i + 1, n):\n",
" d = distance(i, j)\n",
" if d < dmin:\n",
" dmin, imin, jmin = d, i, j\n",
" return (imin, jmin)"
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Sur notre exemple de nuage de points, on obtient"
]
},
{
"cell_type": "code",
"execution_count": 5,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Indices des points les plus proches : 8 et 21\n",
"Point d'indice 8 : (0.371441, 0.322718)\n",
"Point d'indice 21 : (0.348858, 0.334010)\n",
"Distance de ces deux points : 0.025249\n"
]
}
],
"source": [
"i, j = plus_proche()\n",
"Mi, Mj = (coords_x[i], coords_y[i]), (coords_x[j], coords_y[j])\n",
"print('Indices des points les plus proches : {:d} et {:d}'.format(i, j))\n",
"print('Point d\\'indice {:d} : ({:f}, {:f})'.format(i, *Mi))\n",
"print('Point d\\'indice {:d} : ({:f}, {:f})'.format(j, *Mj))\n",
"print('Distance de ces deux points : {:f}'.format(distance(i, j)))"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 4** Donner, en la justifiant sommairement, la complexité de la fonction précédente en fonction de $n$."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Il y a un calcul de distance (ligne 6) et une comparaison de distances (ligne 7) au sein des deux boucles imbriquées, et il n'y en a pas ailleurs. Le nombre d'étapes de calcul est donc donné par\n",
"\n",
"$$\\sum_{i=0}^{n-2}\\sum_{j=i+1}^{n-1} 1 = \\sum_{i=0}^{n-2}(n-1-i) = \n",
" \\sum_{k=1}^{n-1} k = \\frac{n(n-1)}{2}.$$\n",
"\n",
"La complexité du calcul effectué par cette fonction est donc en $\\Theta(n^2)$."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Quelques outils pour saméliorer"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On souhaite maintenant obtenir la distance entre les deux points les plus proches avec une meilleure complexité. Pour cela nous allons décrire un algorithme utilisant une méthode de type *diviser pour régner*. Cette partie introduit des fonctions utiles pour la mise en œuvre de cet algorithme."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On se donne la fonction suivante :"
]
},
{
"cell_type": "code",
"execution_count": 6,
"metadata": {},
"outputs": [],
"source": [
"def tri(liste):\n",
" n = len(liste)\n",
" for i in range(n):\n",
" pos = i\n",
" while pos > 0 and liste[pos] < liste[pos-1]:\n",
" liste[pos], liste[pos-1] = liste[pos-1], liste[pos]\n",
" pos -= 1"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 5** Que renvoie cette fonction ? Que fait-elle ? Le démontrer soigneusement en exhibant un invariant de boucle."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"* Pas de `return` explicite dans cette fonction, elle renvoie donc `None`.\n",
"* En revanche, cette fonction peut échanger des éléments de cette liste (ligne 6). Elle peut donc modifier l'ordre des éléments de la liste.\n",
"* En fait, cette fonction trie les éléments de `liste` dans l'ordre croissant. Cela peut se démontrer avec la propriété « la tranche `liste[0:i+1]` est triée ». \n",
" * Cette propriété est vraie avant d'entrer dans la boucle `for` en considérant qu'alors $i=-1$ car alors la tranche est vide.\n",
" * Cette propriété est invariante à chaque itération. À l'étape $i$, si `liste[0:i]` est triée au début de l'étape, alors `liste[0:i+1]` est triée à la fin de cette étape.\n",
"* À la fin de la boucle, on a $i=n-1$ et la tranche `liste[0:n]`, autrement dit la liste complète est triée."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 6** Donner, en la démontrant, la complexité de la fonction `tri` en fonction de la taille de la liste donnée en paramètre."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"La complexité de cette fonction peut s'exprimer en comptant le nombre de fois que l'on compare deux éléments de la liste, ce qui n'arrive que dans la condition de la boucle `while` (ligne 5). \n",
"\n",
"Le nombre de comparaisons effectuées par la boucle `while` dépend de la liste, mais, pour $i>0$, il y a au minimum une comparaison et au maximum $i$ comparaisons. Pour $i=0$, il n'y a aucune comparaison.\n",
"\n",
"Le nombre total de comparaisons est donc au moins égal à\n",
"$$\\sum_{i=1}^{n-1} 1 = n-1,$$\n",
"et au plus égal à\n",
"$$\\sum_{i=1}^{n-1}i = \\frac{n(n-1)}{2}.$$\n",
"\n",
"Dans le pire des cas le nombre de comparaisons, et donc la complexité de cette fontion est en $O(n^2)$.\n",
"\n",
"**NB** l'algorithme de tri utilisé par cette fonction est connu sous le nom de tri par insertion."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 7** On souhaite trier une liste contenant des indices de points suivant lordre des abscisses croissantes. Que faudrait-il changer à la fonction `tri` ci-dessus pour quelle réalise cette opération ?"
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Si la liste contient les indices de points, et qu'on souhaite la trier par abscisses croissantes, il suffit de remplacer la comparaison \n",
" \n",
" liste[pos] < liste[pos-1]\n",
"par \n",
"\n",
" coords_x[liste[pos]] < coords_x[liste[pos-1]]. "
]
},
{
"cell_type": "code",
"execution_count": 7,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [],
"source": [
"def tri(liste, coords):\n",
" n = len(liste)\n",
" for i in range(n):\n",
" pos = i\n",
" while pos > 0 and coords[liste[pos]] < coords[liste[pos-1]]:\n",
" liste[pos], liste[pos-1] = liste[pos-1], liste[pos]\n",
" pos -= 1"
]
},
{
"cell_type": "code",
"execution_count": 8,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"[12, 19, 4, 2, 29, 24, 16, 11, 22, 26, 25, 6, 31, 21, 8, 13, 30, 23, 17, 27, 0, 20, 1, 15, 14, 3, 10, 18, 7, 5, 28, 9]\n",
"[3, 2, 7, 15, 6, 29, 25, 11, 19, 12, 8, 21, 1, 30, 24, 17, 26, 16, 23, 20, 9, 10, 28, 22, 5, 27, 18, 31, 13, 0, 4, 14]\n"
]
}
],
"source": [
"liste_x = list(range(n))\n",
"tri(liste_x, coords_x)\n",
"print(liste_x)\n",
"liste_y = list(range(n))\n",
"tri(liste_y, coords_y)\n",
"print(liste_y)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 8** Indiquer le nom dun autre algorithme de tri plus efficace dans le pire des cas, ainsi que sa complexité. On ne demande pas de le programmer."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Un tri plus efficace dans le pire des cas est le tri fusion. Sa complexité dans le pire (et le meilleur) des cas est en $O(n\\log(n))$.\n",
"\n",
"**NB** le tri rapide est en $O(n\\log(n))$ en moyenne mais il est en $O(n^2)$ dans le pire des cas."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On admettra que l'on dispose de deux listes de $n$ entiers `liste_x` (resp. `liste_y`) contenant les indices des points du nuage triés par abscisses croissantes (resp. par ordonnées croissantes). On supposera désormais que deux points quelconques ont des abscisses et des ordonnées distinctes."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Dans toute la suite, un sous-ensemble de points sera décrit par un *cluster*. Un cluster est une matrice de deux lignes contenant chacune les mêmes numéros correspondant aux numéros des points dans le sous-ensemble considéré. Dans la première ligne, les points sont triés par abscisses croissantes ; dans la seconde, ils sont triés par ordonnées croissantes. La figure 1 donne la représentation de deux clusters.\n",
"\n",
"![Représentation en Python de deux clusters](clusters.png)"
]
},
{
"cell_type": "code",
"execution_count": 9,
"metadata": {
"tags": [
"hors_enonce"
]
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"[[12, 19, 4, 2, 29, 24, 16, 11, 22, 26, 25, 6, 31, 21, 8, 13, 30, 23, 17, 27, 0, 20, 1, 15, 14, 3, 10, 18, 7, 5, 28, 9], [3, 2, 7, 15, 6, 29, 25, 11, 19, 12, 8, 21, 1, 30, 24, 17, 26, 16, 23, 20, 9, 10, 28, 22, 5, 27, 18, 31, 13, 0, 4, 14]]\n"
]
}
],
"source": [
"cluster = [liste_x, liste_y]\n",
"print(cluster)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Pour être efficace, notre algorithme ne doit pas retrier les listes des indices de points à chaque étape. Nous allons donc définir une fonction qui permet dextraire des indices dun cluster et former ainsi un nouveau cluster plus petit."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 9** Écrire une fonction `sous_cluster(cl, x_min, x_max)` qui prend en arguments un cluster `cl` et deux flottants `x_min` et `x_max`, et renvoie le sous-cluster des points dont labscisse est comprise entre `x_min` et `x_max` (au sens large). Cette fonction doit avoir une complexité linéaire en la taille du cluster."
]
},
{
"cell_type": "code",
"execution_count": 10,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [],
"source": [
"def sous_cluster(cl, xmin, xmax):\n",
" n = len(cl[0])\n",
" premiere_ligne = []\n",
" i = 0\n",
" while i < n and coords_x[cl[0][i]] <= xmax:\n",
" if xmin <= coords_x[cl[0][i]]:\n",
" premiere_ligne.append(cl[0][i])\n",
" i += 1\n",
" deuxieme_ligne = [j for j in cl[1] if j in premiere_ligne]\n",
" return [premiere_ligne, deuxieme_ligne]"
]
},
{
"cell_type": "code",
"execution_count": 11,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"[[22, 26, 25, 6, 31, 21, 8, 13, 30, 23, 17, 27, 0, 20, 1, 15, 14, 3, 10], [3, 15, 6, 25, 8, 21, 1, 30, 17, 26, 23, 20, 10, 22, 27, 31, 13, 0, 14]]\n"
]
}
],
"source": [
"print(sous_cluster(cluster, 0.25, 0.75))"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 10** Écrire une fonction `mediane(cl)` qui prend en entrée un cluster `cl` contenant au moins 2 points et renvoie une abscisse médiane, cest-à-dire que la moitié (au moins) des points a une abscisse inférieure ou égale à cette valeur, et la moitié (au moins) des points a une abscisse supérieure ou égale à cette valeur. Cette fonction doit avoir une complexité en $O(1)$."
]
},
{
"cell_type": "code",
"execution_count": 12,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [],
"source": [
"def mediane(cl):\n",
" n = len(cl[0])\n",
" return (coords_x[cl[0][(n - 1) // 2]] + coords_x[cl[0][n // 2]]) / 2"
]
},
{
"cell_type": "code",
"execution_count": 13,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"0.4233770483817454"
]
},
"execution_count": 13,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"mediane(cluster)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Méthode sophistiquée"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Le fonctionnement de l'algorithme utilisant une méthode de type *diviser pour régner* est illustré par la figure 2 :\n",
"\n",
"1. Si le cluster contient deux ou trois points, on calcule la distance minimale en calculant toutes les distances possibles.\n",
"2. Sinon, on sépare le cluster en deux parties $G$ et $D$ qu'on supposera de tailles égales (éventuellement à un point près) suivant la médiane des abscisses, quon notera $x_0$.\n",
"3. Les deux points les plus proches sont soit tous les deux dans $G$, soit tous les deux dans $D$, soit un dans $G$ et un dans $D$.\n",
"4. On calcule récursivement le couple le plus proche dans $G$ et le couple le plus proche dans $D$. On note $d_0$ la plus petite des deux distances obtenues.\n",
"5. On cherche sil existe une paire de points $(M_1, M_2)$ telle que $M_1$ est dans $G$, $M_2$ dans $D$, et $d(M_1, M_2)< d_0$.\n",
"6. Si on en trouve une (ou plusieurs), on renvoie la plus petite de ces distances. Sinon, on renvoie $d_0$.\n",
"\n",
"![Illustration de la méthode diviser pour régner](points_proches_diviser_regner.png)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 11** Écrire une fonction `gauche(cl)` qui prend en argument un cluster `cl` contenant au moins deux points et renvoie le cluster constitué uniquement de la moitié (éventuellement arrondie à lentier supérieur) des points les plus à gauche du cluster `cl`."
]
},
{
"cell_type": "code",
"execution_count": 14,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [],
"source": [
"def gauche(cl):\n",
" x0 = mediane(cl)\n",
" return sous_cluster(cl, coords_x[cl[0][0]], x0)"
]
},
{
"cell_type": "code",
"execution_count": 15,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"[[12, 19, 4, 2, 29, 24, 16, 11, 22, 26, 25, 6, 31, 21, 8, 13], [2, 6, 29, 25, 11, 19, 12, 8, 21, 24, 26, 16, 22, 31, 13, 4]]\n"
]
}
],
"source": [
"print(gauche(cluster))"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On suppose qu'on dispose d'une fonction `droite(cl)` qui renvoie le cluster contenant tous les autres points du cluster `cl` n'appartenant pas au cluster renvoyé par la fonction `gauche(cl)`."
]
},
{
"cell_type": "code",
"execution_count": 16,
"metadata": {
"tags": [
"hors_enonce"
]
},
"outputs": [],
"source": [
"def droite(cl):\n",
" x0 = mediane(cl)\n",
" return sous_cluster(cl, x0, coords_x[cl[0][-1]])"
]
},
{
"cell_type": "code",
"execution_count": 17,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"[[30, 23, 17, 27, 0, 20, 1, 15, 14, 3, 10, 18, 7, 5, 28, 9], [3, 7, 15, 1, 30, 17, 23, 20, 9, 10, 28, 5, 27, 18, 0, 14]]\n"
]
}
],
"source": [
"print(droite(cluster))"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 12** Justifier que l'on peut se contenter de chercher les points $M_1$ et $M_2$ de l'étape 5 de l'algorithme dans l'ensemble des points dont l'abscisse appartient à $I_0= [x_0-d_0, x_0+d_0]$."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Si $d_0$ est la plus petite des deux distances séparant les deux points les plus proches de la partie gauche du cluster d'une part et les deux points les plus proches de la partie droite d'autre part, alors si dans la bande centrale on trouve deux points à distance strictement inférieure à $d_0$, alors l'un, $M_1$, est nécessairement dans la partie gauche, et l'autre, $M_2$, dans la partie droite (sinon cela contredirait la définition de $d_0$).\n",
"\n",
"Par ailleurs, l'abscisse $x_1$ de $M_1$ ne peut pas être strictement inférieure à $x_0-d_0$ et celle $x_2$ de $M_2$ ne peut pas être strictement supérieure à $x_0+d_0$ car dans le cas contraire on aurait $d(M_1, M_2) > d_0$.\n",
"\n",
"Cela justifie donc qu'il suffit de rechercher l'éventuelle présence d'un couple de points proches dans la bande des points d'abscisse appartenant à l'intervalle $[x_0-d_0, x_0+d_0]$."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 13** Écrire une fonction `bande_centrale(cl, d0)` qui prend en argument un cluster `cl` et un réel `d0`, et renvoie le cluster des points dont l'abscisse est dans $I_0$. Cette fonction doit avoir une complexité linéaire en la taille du cluster."
]
},
{
"cell_type": "code",
"execution_count": 18,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [],
"source": [
"def bande_centrale(cl, d0):\n",
" x0 = mediane(cl)\n",
" return sous_cluster(cl, x0-d0, x0+d0)"
]
},
{
"cell_type": "code",
"execution_count": 19,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"[[22, 26, 25, 6, 31, 21, 8, 13, 30, 23, 17, 27, 0, 20, 1, 15, 14], [15, 6, 25, 8, 21, 1, 30, 17, 26, 23, 20, 22, 27, 31, 13, 0, 14]]\n"
]
}
],
"source": [
"print(bande_centrale(cluster, 0.2))"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 14** Montrer que deux points $M_1$ et $M_2$ (de létape 5 de l'algorithme) situés à une distance inférieure à $d_0$ se trouvent, dans la deuxième ligne du cluster (c'est-à-dire la ligne triée par ordonnées croissantes), séparés d'au plus 6 éléments. \n",
"\n",
"On pourra montrer par l'absurde qu'un rectangle, à préciser, de dimensions $2d_0\\times d_0$ contient au plus 8 points."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Commençons par montrer que dans un carré de côté $c$ il ne peut y avoir qu'au plus quatre points séparés d'une distance au moins égale à $c$.\n",
"\n",
"Supposons qu'on ait cinq points $M_i$, $i=1,..., 5$, tels que pour tout couple $(i, j)\\in [1, 5]^2$, avec $i\\neq j$ on ait\n",
"$$ d(M_i, M_j) \\geq c.$$\n",
"\n",
"Alors en coupant le carré selon une ligne médiane pour obtenir deux rectangles de dimension $c\\times \\frac{c}{2}$, l'un de ces deux rectangles doit contenir au moins trois des cinq points $M_i$. Et en coupant ce rectangle en deux selon une ligne médiane pour obtenir deux carrés de côtés $\\frac{c}{2}$, l'un des deux carrés doit contenir au moins deux points.\n",
"\n",
"Or dans un carré de côté $\\frac{c}{2}$ tout couple de points est à distance au moins égale à $\\frac{c\\sqrt{2}}{2} < c$. Ceci contredit que les cinq points sont à distance au moins égale à $c$. Ce qui établit le fait que dans un carré de côté $c$, on ne peut considérer qu'au maximum quatre points à distance au moins égale à $c$. (Ce qui est possible en considérant les quatre sommets du carré).\n",
"\n",
"Soit $y$ un réel quelconque. Considérons un rectangle $[x_0 - d_0; x_0+d_0]\\times[y; y+d_0]$ situé dans la bande centrée en la médiane $x_0$ du cluster et de largeur $2d_0$, $d_0$ étant la plus petite des deux distances séparant les points les plus proches situés dans le sous-cluster gauche, et les points les plus proches situés dans le sous-cluster droit.\n",
"\n",
"Les points du cluster situés dans partie gauche de ce rectangle, c'est-à dire dans le carré $[x_0-d_0; x_0]\\times [y; y+d_0]$ de côté $d_0$ sont tous à distance au moins égale à $d_0$ les uns des autres. Ils sont donc en nombre au plus égal à quatre. De même pour les points du cluster situés dans la partie droite. Par conséquent le rectangle ne contient qu'au plus huit points du rectangle. (Cette majoration doit pouvoir certainement être améliorée.)\n",
"\n",
"S'ils existent les deux points de la bande centrale à distance dtrictement inférieure à $d_0$ sont situés dans un rectangle de la forme $[x_0 - d_0; x_0+d_0]\\times[y; y+d_0]$ qui ne contient qu'au maximum huit points du cluster. Comme la deuxième ligne est triée par ordre croissant des ordonnées, il y a au maximum six points entre ces deux points."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 15** En déduire une fonction `fusion(cl, d0)` qui prend en entrée un cluster de points dont toutes les abscisses sont dans un intervalle $[x_0-d_0, x_0+d_0]$, et renvoie la distance minimale entre deux points du cluster si elle est inférieure à $d_0$, ou $d_0$ sinon. Cette fonction doit avoir une complexité linéaire en la taille du cluster `cl`. Vous justifierez cette complexité."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Compte-tenu du fait établi dans la question précédente, pour rechercher les deux points $M_1$ et $M_2$ les plus proches dans une bande centrale, il suffit de les rechercher par ordonnées croissantes, et pour une ordonnée fixée, calculer les distances avec les sept points qui suivent dans l'ordre des ordonnées."
]
},
{
"cell_type": "code",
"execution_count": 20,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [],
"source": [
"def fusion(cl, d0):\n",
" n = len(cl[1])\n",
" dmin = d0\n",
" for i in range(n - 1):\n",
" for j in range(i+1, min(n, i+8)):\n",
" dist = distance(cl[1][i], cl[1][j])\n",
" if dist < dmin:\n",
" dmin = dist\n",
" return dmin"
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"La complexité de cette fonction est essentiellement proportionnelle au nombre de fois que les instructions des lignes 6 à 8 sont exécutées, autrement dit au nombre de calculs de distance. Et ce nombre de calculs de distance est égal à\n",
"\n",
"$$ \\sum_{i=0}^{n-2}\\sum_{j=i+1}^{\\min(n-1,i+7)}1 = (\\sum_{i=0}^{n-8}7) + (6 + 5 + 4 + 3 + 2 + 1) =7(n-7) + 21 = 7n - 28.$$\n",
"\n",
"Ceci établit que la complexité de la fonction est en $\\Theta(n)$, et donc qu'elle est linéaire."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 16** Écrire une fonction récursive `distance_minimale(cl)` qui prend en argument un cluster et utilise l'algorithme décrit plus haut pour renvoyer la distance minimale entre deux points du cluster."
]
},
{
"cell_type": "code",
"execution_count": 21,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [],
"source": [
"def distance_minimale(cl):\n",
" n = len(cl[0])\n",
" if n == 2:\n",
" return distance(cl[0][0], cl[0][1])\n",
" else:\n",
" x0 = mediane(cl)\n",
" gauche = sous_cluster(cl, coords_x[cl[0][0]], x0)\n",
" droite = sous_cluster(cl, x0, coords_x[cl[0][-1]])\n",
" d0 = min(distance_minimale(gauche),\n",
" distance_minimale(droite))\n",
" d1 = fusion(sous_cluster(cl, x0-d0, x0+d0), d0)\n",
" return d1"
]
},
{
"cell_type": "code",
"execution_count": 22,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [
{
"data": {
"text/plain": [
"0.025248772056030447"
]
},
"execution_count": 22,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"distance_minimale(cluster)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Remarque :** dans la réalisation de cette fonction, nous n'avons pas utilisé les fonctions déterminant les parties gauche et droite, ainsi que la bande centrale du cluster, car chacune de ces trois fonctions effectue le calcul de la médiane. Notre réalisation n'effectue qu'un seul calcul de médiane."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 17** Si on note $n$ la taille du cluster `cl`, et $C(n)$ le nombre d'opérations élémentaires réalisées par la fonction `distance_minimale(cl)`, justifier que l'on a :\n",
"\n",
"$$ C(n) = 2C(n/2) +O(n).$$"
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Lorsque $n>2$, le nombre $C(n)$ d'opérations élémentaires est égal au nombre d'opérations élémentaires pour chaque appel récursif, qui s'effectue sur des clusters ayant deux fois moins de points, soit $C(n/2)$ pour chacun d'eux, auxquelx il faut ajouter le nombre d'opérations élémentaires pour le calcul de la médiane, le calcul des sous-clusters gauche et droite et la bande centrale, et le calcul de la fusion, chacune de ces étapes s'effectuant avec une complexité linéaire, donc $\\Theta(n)$ opérations supplémentaires au total.\n",
"Ainsi on a pour $n>2$\n",
"\n",
"$$C(n) = 2C(n/2) + \\Theta(n).$$\n",
"\n",
"Pour $n=2$, le seul calcul est un calcul de distance, donc en $\\Theta(1)$.\n",
"\n",
"$$C(2) = \\Theta(1).$$"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 18** En déduire, en la démontrant, la complexité $C(n)$. On pourra se limiter au cas où $n$ est une puissance de 2."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Si on se limite au cas où $n$ est une puissance de deux, alors en posant $n=2^p$ et $c'(p) = C(n)$, les équations précédentes deviennent\n",
"\n",
"$$ c'(p) = 2c(p-1) + \\Theta(2^p),$$\n",
"et\n",
"$$ c'(1) = \\Theta(1).$$\n",
"\n",
"On reconnaît l'équation de récurrence d'une suite récurrente linéaire du 1er ordre, de raison 2 et de second membre $O(2^p)$. Comme ce second membre s'exprime avec une puissance de la raison, la solution de ces équations est donc de la forme\n",
"\n",
"$$c'(p) = \\Theta(p2^p).$$\n",
"\n",
"D'où l'on deduit que, lorsque $n$ est une puissance de deux,\n",
"\n",
"$$C(n) = \\Theta(n\\log(n)).$$\n",
"\n",
"On admet que cela est vrai aussi pour $n$ quelconque. La complexité est donc d'un ordre de grandeur bien inférieur à celui de l'approche exhaustive."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"hors_enonce"
]
},
"source": [
"**Vérification expérimentale des résultats établis**"
]
},
{
"cell_type": "code",
"execution_count": 23,
"metadata": {
"tags": [
"hors_enonce"
]
},
"outputs": [],
"source": [
"from ap2_decorators import count\n",
"distance = count(distance)"
]
},
{
"cell_type": "code",
"execution_count": 24,
"metadata": {
"tags": [
"hors_enonce"
]
},
"outputs": [],
"source": [
"N = 200\n",
"meth1 = []\n",
"meth2 = []\n",
"for n in range(2, N):\n",
" coords_x = [random() for _ in range(n)]\n",
" coords_y = [random() for _ in range(n)]\n",
" distance.counter = 0\n",
" _ = plus_proche()\n",
" meth1.append(distance.counter)\n",
" liste_x = list(range(n))\n",
" tri(liste_x, coords_x)\n",
" liste_y = list(range(n))\n",
" tri(liste_y, coords_y)\n",
" cluster = [liste_x, liste_y]\n",
" distance.counter = 0\n",
" _= distance_minimale(cluster)\n",
" meth2.append(distance.counter)"
]
},
{
"cell_type": "code",
"execution_count": 25,
"metadata": {
"tags": [
"hors_enonce"
]
},
"outputs": [
{
"data": {
"image/png": "\n",
"text/plain": [
"<Figure size 432x288 with 1 Axes>"
]
},
"metadata": {
"needs_background": "light"
},
"output_type": "display_data"
}
],
"source": [
"liste_n = list(range(2, N))\n",
"plt.plot(liste_n, meth1, 'r.', label='méthode 1')\n",
"plt.plot(liste_n, meth2, 'g.', label='méthode 2')\n",
"plt.legend()\n",
"plt.show()"
]
},
{
"cell_type": "code",
"execution_count": 26,
"metadata": {},
"outputs": [],
"source": [
"from math import log"
]
},
{
"cell_type": "code",
"execution_count": 27,
"metadata": {},
"outputs": [
{
"data": {
"image/png": "\n",
"text/plain": [
"<Figure size 432x288 with 1 Axes>"
]
},
"metadata": {
"needs_background": "light"
},
"output_type": "display_data"
}
],
"source": [
"c = 1.3\n",
"plt.plot(liste_n, meth2, 'g.', label='méthode 2')\n",
"plt.plot(liste_n, [c*n*log(n) for n in liste_n], label='{:3.2f} nlog(n)'.format(c))\n",
"plt.legend()\n",
"plt.show()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Problème 2 : Composantes connexes et biconnexes"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Site Internet et bases de données"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On s'intéresse dans cette partie à un site Internet d'échange de supports de cours entre enseignant·e·s de NSI. Chaque personne désirant proposer ou récupérer du contenu doit commencer par se créer un compte sur ce site et peut ensuite accéder à du contenu ou en proposer."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 19** Expliquer sommairement la différence entre Internet et le web."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Internet est un réseau (de réseaux) d'ordinateurs permettant de mettre en place plusieurs protocoles de communication.\n",
"\n",
"Le web est un réseau hypertexte qui fonctionne grâce à Internet. Les nœuds de ce réseau sont des pages consultables grâce à un navigateur (comme Firefox, Safari, Opera, ...)."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 20** Expliquer deux conséquences du règlement général sur la protection des données (RGPD) sur le site Internet."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Ce site repose sur une base de données contenant en particulier trois tables.\n",
"\n",
"- La table `comptes` possède un enregistrement par utilisateur ou utilisatrice, et ses attributs sont :\n",
" - `id`, un identifiant numérique, unique pour chaque compte ;\n",
" - `nom`, le nom de la personne possédant le compte ;\n",
" - et d'autres informations, concernant le mot de passe, l'adresse mail, des préférences sur le site, etc., que nous ne détaillons pas ici.\n",
"- La table `ressources` possède un enregistrement par document téléversé sur le site. Ses attributs sont :\n",
" - `id`, un identifiant numérique, unique pour chaque ressource ;\n",
" - `owner`, l'identifiant de la personne ayant créé la ressource ;\n",
" - `titre`, une chaine de caractères décrivant la ressource ;\n",
" - `type`, chaine de caractères pouvant être `cours`, `ds`, `tp` ou `td`.\n",
"- La table `chargement` mémorise chaque fois qu'un utilisateur télécharge une ressource sur le site. Ses attributs sont :\n",
" - `date`, date du téléchargement, par exemple `'2021-02-28'` pour le 28 février 2021 (on peut utiliser des opérations de comparaison classiques avec ce format) ;\n",
" - `id_u`, identifiant de l'utilisateur qui télécharge la ressource ;\n",
" - `id_r`, identifiant de la ressource téléchargée."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Voici un extrait de chacune de ces tables :\n",
"\n",
"![extrait des trois tables](extrait_tables.png)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 21** Écrire une requête SQL permettant de connaitre le nombre total de ressources de type `cours` présentes sur le site."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"~~~sql\n",
"SELECT COUNT(*) FROM ressources WHERE type = 'cours'\n",
"~~~"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 22** Que fait la requête suivante ?\n",
"\n",
"~~~sql\n",
"SELECT ressources.titre, comptes.nom\n",
"FROM chargement\n",
" JOIN ressources ON ressources.id = chargement.id_r\n",
" JOIN comptes ON comptes.id = chargement.id_u\n",
"ORDER BY chargement.date DESC\n",
"LIMIT 1\n",
"~~~"
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"On obtient une table d'un seul enregistrement contenant le titre de la ressource la plus récemment téléchargée, ainsi que le nom de celui qui a effectué ce téléchargement."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 23** Écrire une requête SQL qui permet de déterminer la liste des triplets $(x, y, n)$, signifiant que la personne possédant l'identifiant $x$ a téléchargé $n$ fois des documents téléversés par la personne possédant l'identifiant $y$."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On définit le graphe non-orienté $G(V, E)$ où $V$ est l'ensemble des identifiants de comptes sur le site et $E\\subset V\\times V$ l'ensemble des paires d'identifiants telles que le premier compte a déjà téléchargé des documents téléversés par l'autre et réciproquement. Ainsi, si $(x, y)\\in E$, alors on doit avoir $(y, x)\\in E$."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 24** Écrire une requête SQL qui renvoie la table des couples $(x, y)$ de $E$."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Composantes connexes"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"L'objectif de cette partie est de déterminer les composantes connexes du graphe $G$ défini à la partie précédente. Dans toute la suite, on notera $|X|$ le cardinal d'un ensemble $X$. On supposera que l'ensemble $V$ est constitué de sommets numérotés par des entiers consécutifs commençant à 0, cest-à-dire que $V=\\{0,1, . . . ,|V|-1\\}$. On dira que deux sommets $x$, $y$ de $V$ sont voisins lorsque $(x, y)\\in E$."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"La requête de la question 24 permet de récupérer le résultat sous forme d'une liste de tuples à deux valeurs. On souhaite avoir plutôt une représentation par listes d'adjacences, à savoir une liste de $|V|$ sous-listes, la $i^e$ sous-liste contenant les voisins du sommet $i$. On illustre ces différentes représentations avec le graphe $G_{ex}$ de la figure 3.\n",
"\n",
"![un graphe exemple](graphe_Gex.png)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Ce graphe serait obtenu à la question 24 sous la forme :"
]
},
{
"cell_type": "code",
"execution_count": 28,
"metadata": {},
"outputs": [],
"source": [
"g_ex_a = [\n",
" (0, 1), (0, 2), (0, 3), (1, 0), (1, 4), (1, 8),\n",
" (2, 0), (2, 3), (3, 0), (3, 2), (3, 6),\n",
" (4, 1), (5, 6), (6, 3), (6, 5),\n",
" (7, 9), (8, 1), (9, 7)\n",
"]"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Sa représentation par listes dadjacences serait :"
]
},
{
"cell_type": "code",
"execution_count": 29,
"metadata": {},
"outputs": [],
"source": [
"g_ex_b = [[1, 2, 3], [0, 4, 8], [0, 3],\n",
" [0, 2, 6], [1], [6], [3, 5], [9], [1], [7]\n",
" ]"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 25** Écrire une fonction `adjacences(n, li)` qui prend en argument un entier `n` correspondant à $|V|$ et `li`, une liste de couples correspondant à un ensemble $E$ (comme par exemple `g_ex_a`) dans un ordre quelconque, et renvoyant la représentation du graphe $G(V, E)$ sous forme de listes dadjacences (comme par exemple `g_ex_b`)."
]
},
{
"cell_type": "code",
"execution_count": 30,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [],
"source": [
"def adjacences(n, li):\n",
" l_adj = [[] for _ in range(n)]\n",
" for (x, y) in li:\n",
" l_adj[x].append(y)\n",
" return l_adj"
]
},
{
"cell_type": "code",
"execution_count": 31,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [
{
"data": {
"text/plain": [
"True"
]
},
"execution_count": 31,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"adjacences(10, g_ex_a) == g_ex_b"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On se donne le programme suivant"
]
},
{
"cell_type": "code",
"execution_count": 32,
"metadata": {},
"outputs": [],
"source": [
"class Arbre():\n",
" def __init__(self, sommet):\n",
" self.sommet = sommet\n",
" self.children = []\n",
" \n",
" def add_child(self, child):\n",
" self.children.append(child)\n",
" \n",
"def parcours(listes_adjacences):\n",
" n = len(listes_adjacences)\n",
" deja_vu = [False] * n\n",
" \n",
" def explorer(i):\n",
" arbre = Arbre(i)\n",
" voisins = listes_adjacences[i]\n",
" for s in voisins:\n",
" if not deja_vu[s]:\n",
" deja_vu[s] = True\n",
" arbre.add_child(explorer(s))\n",
" return arbre\n",
" \n",
" res = []\n",
" for i in range(n):\n",
" if not deja_vu[i]:\n",
" deja_vu[i] = True\n",
" res.append(explorer(i))\n",
" return res "
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 26** Quel est le type de la valeur renvoyée par la fonction `parcours` ? Appliquer à la main cette fonction sur la liste dadjacence `g_ex_b` du graphe $G_{ex}$ de la figure 3, et représenter la valeur de retour de cette fonction. Quel est le nom de ce parcours ?"
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Le type de la valeur renvoyée par la fonction `parcours` est celui de la variable locale `res`. Cette variable est initialisée à une liste vide (ligne 22), et les seules éventuelles modifications se font via la méthode `append` (ligne 26). Le type renvoyé est donc une liste.\n",
"\n",
"On peut ajouter que la liste renvoyée ne contient que des objets de la classe `Arbre`."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 27** Montrer que la complexité de la fonction `parcours` est en $O(|V|+|E|)$. Dans toute la suite, on dira qu'un algorithme ayant cette complexité est *linéaire*."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": []
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 28** Rappeler la définition de la connexité dun graphe."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Un graphe non orienté est connexe si pour tout couple $(x, y)$ de sommets, il existe un chemin menant de $x$ à $y$.\n",
"\n",
"En particulier, un graphe est connexe si et seulement si en partant d'un sommet $x$ quelconque, on peut atteindre n'importe quel autre, autrement dit si l'arbre obtenu par la `explorer(x)` contient tous les sommets du graphe."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 29** Écrire une fonction `connexe(listes_adjacences)` qui renvoie `True` si le graphe décrit par les listes d'adjacences `listes_adjacences` est connexe et `False` sinon."
]
},
{
"cell_type": "code",
"execution_count": 33,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [],
"source": [
"def connexe(liste_adjacences):\n",
" return len(parcours(liste_adjacences)) == 1"
]
},
{
"cell_type": "code",
"execution_count": 34,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [
{
"data": {
"text/plain": [
"False"
]
},
"execution_count": 34,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"connexe(g_ex_b)"
]
},
{
"cell_type": "code",
"execution_count": 35,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [
{
"data": {
"text/plain": [
"True"
]
},
"execution_count": 35,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"# sous graphe de G_ex et renommage du sommet 8 en 7\n",
"autre_graphe = [list(g_ex_b[i]) for i in range(9) if i != 7]\n",
"autre_graphe[1][2] = 7\n",
"connexe(autre_graphe)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 30** Écrire une fonction `composantes_connexes(p_graphe)` prenant en argument `p_graphe` le graphe obtenu avec la fonction `parcours` et renvoie les composantes connexes sous forme de liste de listes de sommets."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"**Remarque** la description de l'argument de la fonction demandée dans l'énoncé ne correspond pas à la réponse fournie à la question 26. On répond donc à cette question en considérant que l'argument de la fonction est un graphe décrit pas une liste d'adjacences."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"On commence par une fonction qui renvoie la liste des sommets contenu dans un arbre."
]
},
{
"cell_type": "code",
"execution_count": 36,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [],
"source": [
"def liste_noeuds(arbre):\n",
" res = [arbre.sommet]\n",
" for child in arbre.children:\n",
" res.extend(liste_noeuds(child))\n",
" return res"
]
},
{
"cell_type": "code",
"execution_count": 37,
"metadata": {},
"outputs": [],
"source": [
"def composantes_connexes(liste_adjacences):\n",
" return list(map(liste_noeuds, parcours(liste_adjacences)))"
]
},
{
"cell_type": "code",
"execution_count": 38,
"metadata": {
"tags": [
"reponse"
]
},
"outputs": [
{
"data": {
"text/plain": [
"[[0, 1, 4, 8, 2, 3, 6, 5], [7, 9]]"
]
},
"execution_count": 38,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"composantes_connexes(g_ex_b)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 31** Quelle est la limitation liée au fait que la fonction `explorer`, codée en Python, est récursive ?"
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Par défaut, Python limite à environ 1000 le nombre des appels récursifs à une fonction. Donc si le graphe contient un grand nombre de sommets de sorte qu'on y trouve un chemin contenant plus de 1000 sommets non visités, la fonction `explorer` ne pourra pas accomplir son travail. "
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Dans toute la suite, lorsqu'une fonction est demandée, on pourra utiliser ou non une fonction récursive, au choix des candidat.e.s."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Graphes biconnexes"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On suppose dans cette partie que $G$ est un graphe connexe. Si $\\forall i\\in [0;k]\\, x_i\\in V$, on appelle *chaine* une suite finie $(x_0, x_1, ... , x_k)$ telle que pour tout $i$, on ait $(x_i, x_{i+1})\\in E$. Cette chaine est un *cycle* lorsque $x_0=x_k$, et c'est de plus un *cycle élémentaire* si tous les sommets $x_0$, ... , $x_{k1}$ sont distincts deux à deux. On dit que $G(V, E)$ est *biconnexe* lorsque :\n",
"\n",
"- $|V|= 1$ ;\n",
"- $|V|= 2$, $V=\\{a, b\\}$ et $(a, b)\\in E$;\n",
"- ou $|V|\\geq 3$ et pour toute paire $(x, y)\\in V^2$, il existe un cycle élémentaire contenant $x$ et $y$."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 32** Montrer qu'un graphe biconnexe est également connexe."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Lorsque $|V|=1\\mbox{ ou }2$, il n'y a pas de distinctions entre la connexité et la biconnexité.\n",
"\n",
"Soit $G=(V, E)$ un graphe à au moins trois sommets, et $x$ et $y$ deux sommets distincts de ce graphe. La biconnexité entraîne l'existence d'un cycle élémentaire $(x_0, x_1, ..., x_k=x_0)$ contenant $x$ et $y$. Il existe deux indices $i$ et $j$ tels que $x_i=x$ et $x_j=y$. On peut toujours supposer que $i<j$. Alors $(x_i=x, x_{i+1}, ..., x_j=y)$ est une chaîne reliant les deux sommets $x$ et $y$. \n",
"\n",
"On est assuré de l'existence d'une chaîne reliant deux sommets quelconques : le graphe est connexe."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 33** Donner un exemple de graphe connexe mais pas biconnexe."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Prenons le graphe à trois sommets et deux arêtes défini par\n",
"\n",
"* $V=\\{a, b, c\\}$ \n",
"* $E=\\{(a, b), (b, c)\\}$.\n",
"\n",
"Ce graphe est évidemment connexe mais pas biconnexe car il n'y a pas de cycle élémentaire contenant les sommets $a$ et $c$."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On dit qu'un sommet $x$ de $G$ est un *point d'articulation* lorsque le graphe $G$ privé du sommet $x$ (et des arêtes issues de $x$) n'est plus connexe. Notre objectif dans cette partie est de montrer la propriété suivante si $G(V, E)$ possède au moins 3 sommets :\n",
"\n",
"$G(V, E)$ est biconnexe si et seulement si $G$ ne possède pas de point darticulation."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"hors_enonce"
]
},
"source": [
"**Remarque** dans un graphe non connexe ayant au moins trois sommets, tous les sommets sont des points d'articulation. "
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 34** Sur le graphe $G'_{ex}$ de la figure 4, donner les points darticulations.\n",
"\n",
"![Graphe de la figure 4](graphe_Gprime_ex.png)"
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Les points d'articulation de $G'_{ex}$ sont les sommets 4, 6, 8 et 11."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Dans toute la suite, on considère un graphe $G$ ayant au moins 3 sommets."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 35** Soit $G(V, E)$ possédant un point d'articulation. Montrer que $G$ n'est pas biconnexe."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Soit $a$ un point d'ariculation de $G$, et considérons le graphe $G'$ obtenu en supprimant $a$ de $V$, ainsi que les arêtes dont une extrémité est $a$. Par définition d'un point d'articulation, le graphe $G'$ n'est pas connexe.\n",
"Considérons $x$ et $y$ deux sommets de $G'$ situés dans deux composantes connexes différentes. Alors deux cas de figures se présentent :\n",
"\n",
"1. Les sommets $x$ et $y$ sont dans deux composantes connexes différentes de $G$, et alors $G$ n'est pas connexe et a fortiori pas biconnexe compte-tenu du résultat établi à la question 32.\n",
"2. Les sommets $x$ et $y$ sont dans une même composante connexe de $G$, et alors toute chaîne menant de $x$ à $y$ doit contenir le point d'articulation $a$. Un éventuel cycle contenant $x$ et $y$ aurait alors la forme $(x_0, ..., x_i=x, ..., x_j=y, ..., x_k=x_0)$. De ce cycle on peut extraire deux chaînes reliant $x$ et $y$ : $(x_i, ..., x_j)$ et $(x_j, ..., x_0, ..., x_i)$. Chacune de ces deux chaînes doit contenir $a$ et le cycle ne peut donc pas être élémentaire. Ainsi, $G$ n'est pas biconnexe."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 36** Inversement, supposons $G(V, E)$ un graphe sans point d'articulation, et tel que $|V|\\geq 3$. Considérons deux sommets $x$ et $y$.\n",
"\n",
"1. Justifier qu'il existe une chaine $(x_0=x, x_1, ... , x_k=y)$ dans le graphe.\n",
"2. Montrer qu'il existe un cycle élémentaire contenant $x_0$ et $x_1$.\n",
"3. Pour $i\\geq 1$, on suppose qu'il existe un cycle élémentaire $C$ contenant $x_0$ et $x_i$. Montrer qu'il existe alors un cycle élémentaire contenant $x_0$ et $x_{i+1}$. On pourra distinguer deux cas selon que $C$ contient ou non $x_{i+1}$.\n",
"4. En déduire que $G$ est biconnexe."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"1. Dans un graphe non connexe ayant au moins trois sommets, tous les sommets sont des points d'articulation. Par conséquent si un graphe n'a pas de points d'articulation, il doit être connexe. Cela entraîne l'existence d'une chaîne $(x_0=x, x_1, ... , x_k=y)$ reliant n'importe quel couple $(x, y)$ de points de ce graphe.\n",
"2. $(x_0, x_1, x_0)$ est un cycle élémentaire.\n",
"3. Soit $i\\leq 1$. Supposons qu'il existe un cycle élémentaire $C$ contenant $x_0$ et $x_i$.\n",
" \n",
" * Supposons que $x_{i+1}\\in C$. Alors $C$ est un cycle élémentaire contenant $x_0$ et $x_i+1$.\n",
" * Supposons maintenant que $x_{i+1}\\not\\in C$. Comme $G$ n'a aucun point d'articulation, il existe une chaîne menant de $x_{i+1}$ à $x_0$ sans passer par $x_i$. On peut toujours considérer que cette chaîne est élémentaire (i.e. ne contient que des sommets distincts). On construit alors un cycle élémentaire en extrayant de $C$ une chaîne menant de $x_0$ à $x_i$, puis en poursuivant avec l'arête $(x_i, x_{i+1})$ (qui existe bien dans la chaîne établie au point 1.). Il suffit de terminer le cycle avec la chaîne élémentaire menant de $x_{i+1}$ à $x_0$.\n",
"4. Grâce aux faits établis aux points 2 et 3, on a par induction qu'il existe un cycle élémentaire contenant $x_0$ et $x_i$ pour n'importe quelle valeur de $i$ comprise entre 1 et $k$. En particulier il existe un cycle élémentaire contenant les deux sommets quelconques $x$ et $y$ de $G$. $G$ est donc biconnexe. "
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 37** Expliquer comment on peut déterminer si un sommet particulier est un point d'articulation à l'aide d'un parcours en profondeur."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Pour déterminer si un sommet $x$ d'un graphe $G$ est un point d'articulation, il suffit de faire un parcours en profondeur à partir sans s'autoriser le repassage par $x$. (Cela revient à initialiser le tableau `deja_vus` à la ligne 11 du code précédent, en mettant la valeur `True` à l'indice correspondant à $x$.)\n",
"\n",
"Alors $x$ est un point d'articulation si et seulement si la liste obtenue a une longueur strictement plus grande que 1."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 38** En déduire un algorithme qui prend en entrée un graphe connexe décrit par ses listes d'adjacences, et détermine si ce graphe est biconnexe en utilisant la propriété précédente. On ne demande pas de programmer cet algorithme en Python. Quelle serait sa complexité en fonction des caractéristiques $|E|$ et $|V|$ du graphe ?"
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Voci la description d'un algorithme permettant de déterminer si un graphe est biconnexe. À chaque étape du TQ on met à jour une variable booléenne `biconnexe` en lui donnant la valeur obtenue par la détermination d\n",
" \n",
" biconnexe = True\n",
" i = 0\n",
" TQ biconnexe et i < |V| faire\n",
" biconnexe = i est un point d'articulation\n",
" i = i+1\n",
" renvoyer biconnexe\n",
" \n",
"Chaque étape du TQ a un coût linéaire, donc en $O(|V| + |E|)$. Le nombre d'étapes du TQ est au maximum égal à $|V|$. Le coût global de cet algorithme pour déterminer le caractère biconnexe d'un graphe est donc $O\\left(|V|(|V|+|E|)\\right)$."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Algorithme efficace pour déterminer les points darticulation"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Dans cette partie, on détaille comment déterminer tous les points d'articulation d'un graphe $G(V, E)$ avec une complexité linéaire."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On modifie le programme `parcours` pour lui faire remplir et renvoyer une liste `prefixe` correspondant aux ordres d'appel de la fonction `explorer`. De plus, on suppose désormais que `listes_adjacences` décrit un graphe connexe, et on ne renverra qu'un seul arbre, issu de l'exploration à partir du sommet 0, et la liste `prefixe`. On utilise `nonlocal` pour que la variable `count` soit définie pour toute la fonction `parcours` et pas uniquement au sein de la fonction `explorer`."
]
},
{
"cell_type": "code",
"execution_count": 40,
"metadata": {},
"outputs": [],
"source": [
"def parcours(listes_adjacences):\n",
" n = len(listes_adjacences)\n",
" deja_vu = [False] * n\n",
" prefixe = [-1] * n\n",
" count = 1\n",
" \n",
" def explorer(i):\n",
" nonlocal count\n",
" prefixe[i] = count\n",
" count += 1\n",
" arbre = Arbre(i)\n",
" voisins = listes_adjacences[i]\n",
" for s in voisins:\n",
" if not deja_vu[s]:\n",
" deja_vu[s] = True\n",
" arbre.add_child(explorer(s))\n",
" return arbre\n",
" deja_vu[0] = True\n",
" return explorer(0), prefixe"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 39** Donner les valeurs de la liste `prefixe` renvoyée par le programme ci-dessus si on l'applique sur le graphe $G'_{ex}$ de la figure 4. On supposera que les voisins sont rangés par ordre croissant de leur numéro dans les listes d'adjacences."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"La figure ci-dessous montre l'arbre des appels récursifs à la fonction `explorer` sur l'exemple du graphe $G'_{ex}$. Les nombres dans les cases encadrées sont les numéros des sommets transmis à la fonction `explorer` dans les différents appels. (Les pointillés infiquent les appels récursifs non envisagés pour cause de sommet déjà vu.) En rouge à côté des sommets, figurent les valeurs de la variable `count` lors de l'appel à la fonction `explorer`, valeur qui sera inscrite dans la liste `prefixe`.\n",
"\n",
"![arbre des appels à explorer](arbre_appels_recursifs_parcours.png)\n",
"\n",
"Ainsi la liste `prefixe` obtenue finalement est\n",
"\n",
" [1, 2, 3, 10, 11, 5, 4, 8, 9, 12, 6, 7, 13]\n",
" \n",
"**Remarque** à noter que la liste porte bien son nom puisqu'elle donne pour chaque sommet son rang dans un parcours préfixe de l'arbre."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 40** Soit $G$ un graphe connexe dans lequel on réalise le parcours avec la fonction ci-dessus, et soit $(i, j)$ une arête de $G$ telle que `prefixe[i] < prefixe[j]`. Montrer que $j$ est un descendant de $i$ dans l'arbre."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Considérons une arête $(i, j)$ de $G$ telle que $\\mathtt{prefixe}[i] < \\mathtt{prefixe}[j]$.\n",
"\n",
"On déduit de cette inégalité que dans le parcours, le sommet $i$ a été rencontré avant le sommet $j$. Au début de l'évaluation de $\\mathtt{explorer}(i)$, $j$ n'a donc pas été déjà vu. Mais il le sera durant cette évaluation parce que $j$ est un voisin de $i$. Et donc $j$ apparaît parmi les successeurs de $i$."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Pour chaque sommet $i$, on note $\\mathcal{V}(i)$ le voisinage de $i$, c'est-à-dire l'ensemble constitué de $i$ et de ses voisins. Par extension, pour tout $A\\subset V$, on notera $\\mathcal{V}(A) = \\cup_{i\\in A}\\mathcal{V}(i)$. En supposant réalisé un parcours dans l'arbre, on notera de plus $\\mathcal{D}(i)$ l'ensemble des descendants de $i$ dans l'arbre. Enfin, on définit $\\mathtt{ord}[i]$ par :\n",
"\n",
"$$ \\mathtt{ord}[i] = \\min_{j\\in \\mathcal{V}(\\mathcal{D}(i))} \\mathtt{prefixe}[j].$$"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 41** Sur le graphe $G'_{ex}$ de la figure 4, donner pour chaque sommet les valeurs de $\\mathtt{ord}[i]$, en se basant sur les valeurs obtenues à la question 39."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"En considérant qu'un sommet d'un arbre fait partie de ses descendants :\n",
"\n",
" ord = [1, 1, 1, 9, 9, 4, 1, 7, 8, 11, 5, 4, 9]"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On admettra qu'un sommet $i$ du graphe qui n'est pas la racine est un point d'articulation si et seulement si un de ses fils $j$ vérifie $\\mathtt{ord}[j] = \\mathtt{prefixe}[i]$. "
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Qu'appelle-t-on racine d'un graphe ? Fils d'un sommet ?"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On supposera de plus qu'on dispose d'une fonction `calcule_ord(listes_adjacences)` qui renvoie la liste des $\\mathtt{ord}[i]$ du graphe décrit par `listes_adjacences`, avec une complexité linéaire."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 42** Écrire une fonction `points_articulation(listes_adjacences)` qui renvoie la liste des points d'articulation d'un graphe. On fera attention à traiter la racine de l'arbre comme un cas particulier."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"~~~python\n",
"def points_articulation(liste_adjacences):\n",
" arbre, prefixe = parcours(liste_adjacences)\n",
" ord = calcule_ord(liste_adjacences)\n",
" \n",
"~~~"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On définit une composante biconnexe d'un graphe $G$ comme un sous-ensemble de sommets maximal (au sens de l'inclusion) qui est biconnexe."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 43** Sur le graphe $G'_{ex}$ de la figure 4, donner la liste des composantes biconnexes."
]
},
{
"cell_type": "markdown",
"metadata": {
"tags": [
"reponse"
]
},
"source": [
"Les composantes biconnexes de $G'_{ex}$ sont les sous-graphes induits par les sous-ensembles suivants de sommets :\n",
"\n",
"* $\\{0, 1, 2, 5, 6, 10\\}$,\n",
"* $\\{6, 11\\}$,\n",
"* $\\{7, 8, 11\\}$,\n",
"* $\\{8, 12\\}$,\n",
"* $\\{3, 4, 8\\}$,\n",
"* $\\{4, 9\\}$.\n",
"\n",
"**Remarque** contrairement aux composantes connexes, deux composantes biconnexes distinctes peuvent contenir un même sommet. Ces sommets figurant dans deux composantes biconnexes distinctes sont les points d'articulation.\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Question 44** Décrire un algorithme qui renvoie les composantes biconnexes d'un graphe avec une complexité linéaire. On ne demande pas de programmer cet algorithme."
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.7.3"
},
"toc-autonumbering": true,
"toc-showcode": false,
"widgets": {
"application/vnd.jupyter.widget-state+json": {
"state": {},
"version_major": 2,
"version_minor": 0
}
}
},
"nbformat": 4,
"nbformat_minor": 4
}