{ "cells": [ { "cell_type": "raw", "metadata": {}, "source": [ "---\n", "CAPES NSI 2021\n", "Épreuve n°1\n", "date: 22/03/2021\n", "---" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Cette épreuve est constituée de deux problèmes indépendants." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Pour ce sujet, **le langage de programmation utilisé sera Python**. Vous pourrez utiliser les fonctions Python de manipulation de listes ou de matrices suivantes :\n", "\n", "* Création d’une liste de taille $n$ remplie avec la valeur $x$ : `li = [x] * n`. \n", "* Obtention de la taille d’une liste `li` : `len(li)`.\n", "* Si `li` est une liste de $n$ éléments, on peut accéder au $k^e$ élément (pour $0\\leq k < \\mathtt{len(li)}$) avec `li[k]`. On peut définir sa valeur avec `li[k] = x`.\n", "* Un élément $x$ peut être ajouté dans une liste `li` à l’aide de `li.append(x)`. On considèrera qu’il s’agit d’une opération élémentaire.\n", "* Les matrices sont des listes de listes, chaque sous-liste étant considérée comme une ligne de la matrice. Si `mat` est une matrice, elle possède `len(mat)` lignes et `len(mat[0])` colonnes.\n", "* Création d’une matrice de $n$ lignes et $p$ colonnes, dont toutes les cases contiennent $x$ : `mat = [[x for j in range(p)] for i in range(n)]`.\n", "* On accède à (resp. modifie) l’élément de `mat` dans la $i^e$ ligne et $j^e$ colonne avec `mat[i][j]` (resp. `mat[i][j] = x`).\n", "\n", "À moins de les redéfinir explicitement, l’utilisation de toute autre fonction sur les listes (`sort`, `index`, `max`, etc.) est interdite. On rappelle enfin qu’une fonction qui s’arrête sans avoir rencontré l’instruction `return`renvoie `None`." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Problème 1 : Points proches dans le plan" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Ce problème, pouvant par exemple survenir dans le domaine de la navigation maritime, vise à détermi-ner, dans un nuage de points du plan, la paire de points les plus proches. Il est constitué de trois parties dépendantes." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Formellement, on suppose qu'on dispose de $n$ points dans le plan ($M_0$, $M_1$, ..., $M_{n-1}$) dans un ordre quelconque pour le moment. Ils seront représentés en Python par deux listes de flottants de taille $n$ : `coords_x` et `coords_y`, donnant respectivement les abscisses et les ordonnées des points. On dira ainsi que $M_i$ est le point d'indice $i$, qu'il a pour abscisse $x_i =$ `coords_x[i]` et pour ordonnée $y_i=$`coords_y[i]`. On supposera que `coords_x` et `coords_y` sont des variables globales, qu'on ne modifiera jamais au cours de l'exécution de l’algorithme." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "hors_enonce" ] }, "source": [ "Exemple de nuage de points aléatoires" ] }, { "cell_type": "code", "execution_count": 1, "metadata": { "tags": [ "hors_enonce" ] }, "outputs": [], "source": [ "from random import random\n", "n = 32\n", "coords_x = [random() for _ in range(n)]\n", "coords_y = [random() for _ in range(n)]" ] }, { "cell_type": "code", "execution_count": 2, "metadata": { "tags": [ "hors_enonce" ] }, "outputs": [ { "data": { "image/png": "iVBORw0KGgoAAAANSUhEUgAAAXQAAAD4CAYAAAD8Zh1EAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjMuMCwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy86wFpkAAAACXBIWXMAAAsTAAALEwEAmpwYAAASqUlEQVR4nO3dXYxk513n8e8vY2YjIC+wM0CwPRmjHUuMAkuilkkDIo3GrMa+sJHCsrbIElZWRsAaIYGQjEJCZF+MAoILhHdhlI0CkYgxES8jZSKz8bplKbTNtJXgxBPZGcyLx8niIRjfRMGx+XNxqk3Rqe4603266vSp70ca1ak6j7r+fWrqV08/56nnpKqQJO1/r5p3AZKkbhjokjQQBrokDYSBLkkDYaBL0kBcNa8nPnToUB09enReTy9J+9Jjjz32D1V1eNK+uQX60aNHWV9fn9fTS9K+lORvt9o3dcglyQeTPJfks1vsT5LfTHIxyeNJ3rKbYiVJO9NmDP1DwMlt9t8EHBv9OwX8792XJUm6UlMDvaoeBv5xmya3Ar9XjUeA1yd5Q1cFSpLa6WKWy9XAM2P3L40e+xpJTiVZT7J++fLlDp5akrRhptMWq+pMVS1V1dLhwxNP0kqSdqiLQH8WuHbs/jWjxyRJM9RFoJ8FfmI02+WtwAtV9cUOfq40fGtrcPp0cyvt0tR56Ek+AqwAh5JcAn4F+DqAqvpt4BxwM3AR+DLwP/aqWE2xtgarq7CyAsvL865G06ytwYkT8OKLcPAgPPigr5t2ZWqgV9XtU/YX8D87q0g7YzjsP6urzev18svN7eqqr5l2xbVchmJSOKjfVlaaD98DB5rblZV5V6R9bm5f/VfHNsJho4duOPTf8nLzl5TDZOqIgT4UhsP+tLzsa6XOGOhDYjjMniei1SMGurRTnohWz3hSVNopT0SrZwx0aaecpaKecchF2ilPRKtnDHRpNzwRrR5xyEWSBsJAl6SBMNDVX21XInTFQglwDF191XaOt3PBpVfYQ1c/tZ3j7Vxw6RUGuvqp7Rxv54JLr3DIRf3Udo73LOaCL8J6LYvwOy6ANNenmL2lpaVaX1+fy3NLrS3CGP0i/I4DkuSxqlqatM8hF2k7izBGvwi/44Iw0KXtLMIY/SL8jgvCMXRpO4uwXssi/I4LwjF0SdpHHEOXpAVgoEvSQBjokjQQBrokDYSBLkkDYaBL0kAY6JI0EAa6JA2EgS5p57xaVK/41X/tDZdjHT5XaewdA13d842+GCat0rjT19kOQCdaDbkkOZnkySQXk9w1Yf+RJA8l+VSSx5Pc3H2p2jdcjnUxdLVK40YH4D3vaW4dvtmxqYGe5ABwL3ATcBy4PcnxTc1+Gbi/qt4M3Ab8r64L1T7icqyLYWOVxnvu2d1fYXYAOtNmyOUG4GJVPQ2Q5D7gVuDCWJsCXjvafh3whS6L1D7jcqyLY3l596/vRgdgY4jODsCOtQn0q4Fnxu5fAr53U5v3AX+W5GeBbwBunPSDkpwCTgEcOXLkSmvVftLFG12LwQ5AZ7o6KXo78KGq+vUky8CHk7ypqv5lvFFVnQHOQLMeekfPLWm/swPQiTYnRZ8Frh27f83osXF3APcDVNUa8GrgUBcFSpLaaRPo54FjSa5LcpDmpOfZTW3+DjgBkOQ7aQL9cpeFSpK2NzXQq+ol4E7gAeBzNLNZnkhyd5JbRs1+AXhXkr8EPgL8ZM3r2naStKBajaFX1Tng3KbH3ju2fQH4/m5LkyRdCddykaSBMNAlaSAMdEkaCANdkgbCQJekgTDQpaHy4hMLx/XQpSFyTfqFZA9dGiKXpF1IBro0RK5Jv5AccpGGyCVpF5KBLg2VS9IuHIdcJGkgDHRJ/eOUyx1xyEVSvzjlcsfsoUvqF6dc7piBLqlfnHK5Yw65SOoXp1zumIEuqX+ccrkjDrlI0kAY6JI0EAa6JA2EgS5JA2GgS9JAGOiSNBAGuiQNhIEuSQNhoEvSQBjoUpdc9lVz5Ff/pa647KvmzB661BWXfdWcGehSV1z2VXPWKtCTnEzyZJKLSe7aos2PJbmQ5Ikkv99tmdI+sLHs6z33ONyiuZg6hp7kAHAv8MPAJeB8krNVdWGszTHgl4Dvr6rnk3zLXhUs9ZrLvmqO2vTQbwAuVtXTVfUicB9w66Y27wLurarnAarquW7LlCRN0ybQrwaeGbt/afTYuOuB65N8MskjSU52VaAkqZ2upi1eBRwDVoBrgIeTfFdV/dN4oySngFMAR44c6eiptWNra17my2OgAWkT6M8C147dv2b02LhLwKNV9VXgr5M8RRPw58cbVdUZ4AzA0tJS7bRodcA50x4DDU6bIZfzwLEk1yU5CNwGnN3U5k9oeuckOUQzBPN0d2Wqc86Z9hhocKYGelW9BNwJPAB8Dri/qp5IcneSW0bNHgC+lOQC8BDwi1X1pb0qWh1wzrTHQIOTqvmMfCwtLdX6+vpcnlsjjh97DLTvJHmsqpYm7jPQJWn/2C7Q/eq/JA2EgS5JA2GgS9JAGOiSNBAGuiQNhIEuSQNhoEvSQBjokjQQBrokDYSBrvlaW4PTp5tbSbvS1Xro0pVz+VqpU/bQNT8uXyt1ykAfuj4PafR5+do+HzdpCw65DFnfhzSWl5ua+rZ8bd+Pm7QFA33IJg1p9C2Ylpf7V9N+OG7SBA65DFmfhzT6zOOmfcoe+pD1dUij7zxu2qe8YpEk7SNesUiSFoCBLkkDYaBL0kAY6JI0EAa6JA2EgS5JA2GgS9JAGOiSNBAGuiQNhIEuSQNhoEvSQBjokjQQBrokDUSrQE9yMsmTSS4muWubdm9PUkkmrgQmSdo7UwM9yQHgXuAm4Dhwe5LjE9q9Bvg54NGui5QkTdemh34DcLGqnq6qF4H7gFsntLsHeD/wlQ7rkyS11CbQrwaeGbt/afTYK5K8Bbi2qj623Q9KcirJepL1y5cvX3GxkqSt7fqkaJJXAb8B/MK0tlV1pqqWqmrp8OHDu31qSdKYNoH+LHDt2P1rRo9teA3wJmA1yd8AbwXOemJUkmarTaCfB44luS7JQeA24OzGzqp6oaoOVdXRqjoKPALcUlVeMFSSZmhqoFfVS8CdwAPA54D7q+qJJHcnuWWvC5T2zNoanD7d3EoDcFWbRlV1Dji36bH3btF2ZfdlSXtsbQ1OnIAXX4SDB+HBB2F5ed5VSbviN0W1mFZXmzB/+eXmdnW1259v719z0KqHLg3OykrTM9/ooa+sdPez7f1rTgx0Labl5SZoV1ebMO8ycCf1/g10zYCBrsW1vLw3QbuXvX9pGwa61LW97P1L2zDQpb2wV71/aRvOclH/OWNEasUeuvrNGSNSa/bQ1W9bzRe31y59DXvo6rdJM0bstUsT2UNXv23MGLnnnn8L7r3+lqe0T9lDV/9tnjHiPG9pIgO9T9bWnLvchvO8pYkM9L5wXPjKOM9b+hqOoffFbsaFnfEhCXvo/bHTcWF79pJG7KH3xaTZHG3Mc8aHfxlIvWIPvU92Mi48rxkf/mUg9Y6Bvt/Na8aHa35LvWOgD8E8Znw4F1zqHQNdO+NccKl3DHTtXNd/GfjFKmlXDHT1gydZpV1z2qL6wQW3pF0z0NUPGydZDxzwJKu0Qw65qB88ySrtmoGu/nDBLWlXHHKRpIEw0CVpIAx0SRoIA12SBsJAl6SBaBXoSU4meTLJxSR3Tdj/80kuJHk8yYNJ3th9qZKk7UwN9CQHgHuBm4DjwO1Jjm9q9ilgqaq+G/go8KtdFypJ2l6bHvoNwMWqerqqXgTuA24db1BVD1XVl0d3HwGu6bZMSdI0bQL9auCZsfuXRo9t5Q7g45N2JDmVZD3J+uXLl9tXKUmaqtOTokneASwBvzZpf1Wdqaqlqlo6fPhwl08tSQuvzVf/nwWuHbt/zeixfyfJjcC7gbdV1T93U54kqa02PfTzwLEk1yU5CNwGnB1vkOTNwO8At1TVc92XKUmaZmqgV9VLwJ3AA8DngPur6okkdye5ZdTs14BvBP4wyaeTnN3ix0mS9kir1Rar6hxwbtNj7x3bvrHjuiRJV8hvikrSQBjokjQQBvqQra3B6dPNraTB84pFQ7W2BidONBdcPniwubybVwOSBs0e+lCtrjZh/vLLze3q6rwrkrTHDPShWllpeuYHDjS3KyvzrkjSHnPIZaiWl5thltXVJswdbpEGz0AfsuVlg1xaIA65SNJAGOiSNBAGuiQNhIEuSQNhoEvSQBjokjQQBrokDYSBLkkDYaBL0kAY6JI0EAa6JA2EgS5JA2GgS9JAGOiSNBAGuiQNhIEuSQNhoKs/1tbg9OnmVtIV84pF6oe1NThxormg9cGDzeXzvNqSdEXsoasfVlebMH/55eZ2dXXeFUn7joGuflhZaXrmBw40tysr865I2nccclE/LC83wyyrq02YO9wiXTEDXf2xvLxYQb625geYOmWgS/OwH08C+wHUewb6UPnm67dJJ4H7/Drtxw+gBdTqpGiSk0meTHIxyV0T9v+HJH8w2v9okqOdV6r2Nt5873lPc+u87v7p4iTwLOftOwtpX5jaQ09yALgX+GHgEnA+ydmqujDW7A7g+ar6T0luA94P/Le9KFgt7Lfe3yLa7UngWfeYNz6ANp7PWUi91GbI5QbgYlU9DZDkPuBWYDzQbwXeN9r+KPBbSVJV1WGtass33/6wm5PAs/7QdhbSvtAm0K8Gnhm7fwn43q3aVNVLSV4A/iPwD+ONkpwCTgEcOXJkhyVrKt98wzePD+1Fm4W0D830pGhVnQHOACwtLdl730u++YbND21N0CbQnwWuHbt/zeixSW0uJbkKeB3wpU4qlDSZH9rapM0sl/PAsSTXJTkI3Aac3dTmLPDO0faPAv/P8XNJmq2pPfTRmPidwAPAAeCDVfVEkruB9ao6C/wf4MNJLgL/SBP6kqQZajWGXlXngHObHnvv2PZXgP/abWmSpCvhaouSNBAGuiQNhIEuSQOReU1GSXIZ+NsZPuUhNn3RqYescff6Xh9YY1f6XuNe1ffGqjo8acfcAn3WkqxX1dK869iONe5e3+sDa+xK32ucR30OuUjSQBjokjQQixToZ+ZdQAvWuHt9rw+ssSt9r3Hm9S3MGLokDd0i9dAladAMdEkaiMEGepJvTvJ/k3x+dPtNE9p8T5K1JE8keTzJTC6b1/drtLao7+eTXBgdsweTvHGW9bWpcazd25NUkplPb2tTY5IfGx3LJ5L8ft9qTHIkyUNJPjV6vW+ecX0fTPJcks9usT9JfnNU/+NJ3jLL+lrW+OOj2j6T5M+T/Oc9K6aqBvkP+FXgrtH2XcD7J7S5Hjg22v524IvA6/e4rgPAXwHfARwE/hI4vqnNzwC/Pdq+DfiDGR63NvX9EPD1o+2fnmV9bWsctXsN8DDwCLDUtxqBY8CngG8a3f+WHtZ4Bvjp0fZx4G9mXOMPAm8BPrvF/puBjwMB3go8Osv6Wtb4fWOv8U17WeNge+g01zn93dH27wI/srlBVT1VVZ8fbX8BeA6Y+A2sDr1yjdaqehHYuEbruPHaPwqcSJI9rqt1fVX1UFV9eXT3EZqLnsxSm2MIcA/NBcu/MsviRtrU+C7g3qp6HqCqnuthjQW8drT9OuALM6yPqnqYZknurdwK/F41HgFen+QNs6muMa3GqvrzjdeYPX6/DDnQv7Wqvjja/v/At27XOMkNNL2Uv9rjuiZdo/XqrdpU1UvAxjVaZ6FNfePuoOkhzdLUGkd/el9bVR+bZWFj2hzH64Hrk3wyySNJTs6sukabGt8HvCPJJZoltH92NqW1dqX/X+dtT98vM72maNeSfAL4tgm73j1+p6oqyZbzM0ef6B8G3llV/9JtlcOV5B3AEvC2edcyLsmrgN8AfnLOpUxzFc2wywpNr+3hJN9VVf80z6I2uR34UFX9epJlmgvZvMn3yZVL8kM0gf4De/Uc+zrQq+rGrfYl+fskb6iqL44Ce+Kfs0leC3wMePfoT7a91vdrtLapjyQ30nxwvq2q/nlGtW2YVuNrgDcBq6ORqm8Dzia5parWe1IjNL3JR6vqq8BfJ3mKJuDPz6bEVjXeAZwEqKq1JK+mWXRq1sNDW2n1/3Xeknw38AHgpqras/fykIdcxq9z+k7gTzc3GF0j9Y9pxuA+OqO6+n6N1qn1JXkz8DvALXMY951aY1W9UFWHqupoVR2lGbecZZhPrXHkT2h65yQ5RDME83TPavw74MSoxu8EXg1cnmGN05wFfmI02+WtwAtjQ629kOQI8EfAf6+qp/b0yWZ9RnhW/2jGnB8EPg98Avjm0eNLwAdG2+8Avgp8euzf98ygtpuBp2jG6989euxumtCB5k3zh8BF4C+A75jxsZtW3yeAvx87Zmfn8PpuW+OmtqvMeJZLy+MYmqGhC8BngNt6WONx4JM0M2A+DfyXGdf3EZrZZ1+l+YvmDuCngJ8aO4b3jur/zJxe52k1fgB4fuz9sr5XtfjVf0kaiCEPuUjSQjHQJWkgDHRJGggDXZIGwkCXpIEw0CVpIAx0SRqIfwWBVCV24nXHCAAAAABJRU5ErkJggg==\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "from matplotlib import pyplot as plt\n", "plt.plot(coords_x, coords_y, 'r.')\n", "plt.axis('equal')\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Approche exhaustive" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On utilise la distance euclidienne définie par $d(M_i, M_j) = \\sqrt{(x_j-x_i)^2+(y_j-y_i)^2}$." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 1** Écrire une fonction `distance(i, j)` qui renvoie la distance entre les points $M_i$\n", " et $M_j$. On utilisera la fonction `sqrt` après l’avoir importée." ] }, { "cell_type": "code", "execution_count": 3, "metadata": { "tags": [ "reponse" ] }, "outputs": [], "source": [ "from math import sqrt\n", "def distance(i, j):\n", " return sqrt((coords_x[j] - coords_x[i])**2 + (coords_y[j] - coords_y[i])**2)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 2** Rappeler sommairement comment sont stockés les flottants en mémoire. Quelle conséquence cela peut-il avoir sur le calcul de la distance ? On ignorera par la suite les problèmes d’approximation." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Les flottants permettent de représenter des (approximations de) nombres réels. Cette représentation s'appuie sur le fait qu'étant donné un entier $b>1$, tout nombre réel $x$ non nul peut s'écrire d'une unique façon sous la forme\n", "$$ x = (-1)^s\\times b^e\\times m,$$\n", "où\n", "\n", "* $s\\in\\{0, 1\\}$ précise le *signe* de $x$ ;\n", "* $e\\in\\mathbb{Z}$ est un *exposant* donnant l'ordre de grandeur de $x$ dans la base $b$ ;\n", "* $m\\in[1, b[$ est un réel appelé *mantisse*.\n", "\n", "Dans la pratique, par exemple dans la norme IEEE 754, la représentation des flottants se fait sur un nombre fixé de bits divisés en trois parties :\n", "\n", "* un bit pour le signe ;\n", "* quelques bits pour l'exposant ;\n", "* les bits restant pour la mantisse.\n", "\n", "Cette représentation a pour conséquences \n", "\n", "1. un nombre fini de réels peuvent être représentés (au maximum $2^n$ réels si $n$ est le nombre total de bits de la représentation) ;\n", "2. pour la plupart des nombres réels la mantisse ne peut pas être écrite entièrement : il faut la tronquer ;\n", "3. les opérations arithmétiques élémentaires sur les nombres flottants produisent des résultats mathématiquement faux, mais le plus souvent (heureusement) approximativement corrects." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 3** Écrire une fonction `plus_proche()` qui renvoie, à l’aide d’une recherche exhaustive, le couple d'entiers des indices $i$ et $j$ des deux points les plus proches du nuage de points." ] }, { "cell_type": "code", "execution_count": 4, "metadata": { "tags": [ "reponse" ] }, "outputs": [], "source": [ "def plus_proche():\n", " dmin = float('inf')\n", " imin = jmin = -1\n", " for i in range(n - 1):\n", " for j in range(i + 1, n):\n", " d = distance(i, j)\n", " if d < dmin:\n", " dmin, imin, jmin = d, i, j\n", " return (imin, jmin)" ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Sur notre exemple de nuage de points, on obtient" ] }, { "cell_type": "code", "execution_count": 5, "metadata": { "tags": [ "reponse" ] }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Indices des points les plus proches : 8 et 21\n", "Point d'indice 8 : (0.371441, 0.322718)\n", "Point d'indice 21 : (0.348858, 0.334010)\n", "Distance de ces deux points : 0.025249\n" ] } ], "source": [ "i, j = plus_proche()\n", "Mi, Mj = (coords_x[i], coords_y[i]), (coords_x[j], coords_y[j])\n", "print('Indices des points les plus proches : {:d} et {:d}'.format(i, j))\n", "print('Point d\\'indice {:d} : ({:f}, {:f})'.format(i, *Mi))\n", "print('Point d\\'indice {:d} : ({:f}, {:f})'.format(j, *Mj))\n", "print('Distance de ces deux points : {:f}'.format(distance(i, j)))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 4** Donner, en la justifiant sommairement, la complexité de la fonction précédente en fonction de $n$." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Il y a un calcul de distance (ligne 6) et une comparaison de distances (ligne 7) au sein des deux boucles imbriquées, et il n'y en a pas ailleurs. Le nombre d'étapes de calcul est donc donné par\n", "\n", "$$\\sum_{i=0}^{n-2}\\sum_{j=i+1}^{n-1} 1 = \\sum_{i=0}^{n-2}(n-1-i) = \n", " \\sum_{k=1}^{n-1} k = \\frac{n(n-1)}{2}.$$\n", "\n", "La complexité du calcul effectué par cette fonction est donc en $\\Theta(n^2)$." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Quelques outils pour s’améliorer" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On souhaite maintenant obtenir la distance entre les deux points les plus proches avec une meilleure complexité. Pour cela nous allons décrire un algorithme utilisant une méthode de type *diviser pour régner*. Cette partie introduit des fonctions utiles pour la mise en œuvre de cet algorithme." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On se donne la fonction suivante :" ] }, { "cell_type": "code", "execution_count": 6, "metadata": {}, "outputs": [], "source": [ "def tri(liste):\n", " n = len(liste)\n", " for i in range(n):\n", " pos = i\n", " while pos > 0 and liste[pos] < liste[pos-1]:\n", " liste[pos], liste[pos-1] = liste[pos-1], liste[pos]\n", " pos -= 1" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 5** Que renvoie cette fonction ? Que fait-elle ? Le démontrer soigneusement en exhibant un invariant de boucle." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "* Pas de `return` explicite dans cette fonction, elle renvoie donc `None`.\n", "* En revanche, cette fonction peut échanger des éléments de cette liste (ligne 6). Elle peut donc modifier l'ordre des éléments de la liste.\n", "* En fait, cette fonction trie les éléments de `liste` dans l'ordre croissant. Cela peut se démontrer avec la propriété « la tranche `liste[0:i+1]` est triée ». \n", " * Cette propriété est vraie avant d'entrer dans la boucle `for` en considérant qu'alors $i=-1$ car alors la tranche est vide.\n", " * Cette propriété est invariante à chaque itération. À l'étape $i$, si `liste[0:i]` est triée au début de l'étape, alors `liste[0:i+1]` est triée à la fin de cette étape.\n", "* À la fin de la boucle, on a $i=n-1$ et la tranche `liste[0:n]`, autrement dit la liste complète est triée." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 6** Donner, en la démontrant, la complexité de la fonction `tri` en fonction de la taille de la liste donnée en paramètre." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "La complexité de cette fonction peut s'exprimer en comptant le nombre de fois que l'on compare deux éléments de la liste, ce qui n'arrive que dans la condition de la boucle `while` (ligne 5). \n", "\n", "Le nombre de comparaisons effectuées par la boucle `while` dépend de la liste, mais, pour $i>0$, il y a au minimum une comparaison et au maximum $i$ comparaisons. Pour $i=0$, il n'y a aucune comparaison.\n", "\n", "Le nombre total de comparaisons est donc au moins égal à\n", "$$\\sum_{i=1}^{n-1} 1 = n-1,$$\n", "et au plus égal à\n", "$$\\sum_{i=1}^{n-1}i = \\frac{n(n-1)}{2}.$$\n", "\n", "Dans le pire des cas le nombre de comparaisons, et donc la complexité de cette fontion est en $O(n^2)$.\n", "\n", "**NB** l'algorithme de tri utilisé par cette fonction est connu sous le nom de tri par insertion." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 7** On souhaite trier une liste contenant des indices de points suivant l’ordre des abscisses croissantes. Que faudrait-il changer à la fonction `tri` ci-dessus pour qu’elle réalise cette opération ?" ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Si la liste contient les indices de points, et qu'on souhaite la trier par abscisses croissantes, il suffit de remplacer la comparaison \n", " \n", " liste[pos] < liste[pos-1]\n", "par \n", "\n", " coords_x[liste[pos]] < coords_x[liste[pos-1]]. " ] }, { "cell_type": "code", "execution_count": 7, "metadata": { "tags": [ "reponse" ] }, "outputs": [], "source": [ "def tri(liste, coords):\n", " n = len(liste)\n", " for i in range(n):\n", " pos = i\n", " while pos > 0 and coords[liste[pos]] < coords[liste[pos-1]]:\n", " liste[pos], liste[pos-1] = liste[pos-1], liste[pos]\n", " pos -= 1" ] }, { "cell_type": "code", "execution_count": 8, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[12, 19, 4, 2, 29, 24, 16, 11, 22, 26, 25, 6, 31, 21, 8, 13, 30, 23, 17, 27, 0, 20, 1, 15, 14, 3, 10, 18, 7, 5, 28, 9]\n", "[3, 2, 7, 15, 6, 29, 25, 11, 19, 12, 8, 21, 1, 30, 24, 17, 26, 16, 23, 20, 9, 10, 28, 22, 5, 27, 18, 31, 13, 0, 4, 14]\n" ] } ], "source": [ "liste_x = list(range(n))\n", "tri(liste_x, coords_x)\n", "print(liste_x)\n", "liste_y = list(range(n))\n", "tri(liste_y, coords_y)\n", "print(liste_y)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 8** Indiquer le nom d’un autre algorithme de tri plus efficace dans le pire des cas, ainsi que sa complexité. On ne demande pas de le programmer." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Un tri plus efficace dans le pire des cas est le tri fusion. Sa complexité dans le pire (et le meilleur) des cas est en $O(n\\log(n))$.\n", "\n", "**NB** le tri rapide est en $O(n\\log(n))$ en moyenne mais il est en $O(n^2)$ dans le pire des cas." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On admettra que l'on dispose de deux listes de $n$ entiers `liste_x` (resp. `liste_y`) contenant les indices des points du nuage triés par abscisses croissantes (resp. par ordonnées croissantes). On supposera désormais que deux points quelconques ont des abscisses et des ordonnées distinctes." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Dans toute la suite, un sous-ensemble de points sera décrit par un *cluster*. Un cluster est une matrice de deux lignes contenant chacune les mêmes numéros correspondant aux numéros des points dans le sous-ensemble considéré. Dans la première ligne, les points sont triés par abscisses croissantes ; dans la seconde, ils sont triés par ordonnées croissantes. La figure 1 donne la représentation de deux clusters.\n", "\n", "![Représentation en Python de deux clusters](clusters.png)" ] }, { "cell_type": "code", "execution_count": 9, "metadata": { "tags": [ "hors_enonce" ] }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[12, 19, 4, 2, 29, 24, 16, 11, 22, 26, 25, 6, 31, 21, 8, 13, 30, 23, 17, 27, 0, 20, 1, 15, 14, 3, 10, 18, 7, 5, 28, 9], [3, 2, 7, 15, 6, 29, 25, 11, 19, 12, 8, 21, 1, 30, 24, 17, 26, 16, 23, 20, 9, 10, 28, 22, 5, 27, 18, 31, 13, 0, 4, 14]]\n" ] } ], "source": [ "cluster = [liste_x, liste_y]\n", "print(cluster)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Pour être efficace, notre algorithme ne doit pas retrier les listes des indices de points à chaque étape. Nous allons donc définir une fonction qui permet d’extraire des indices d’un cluster et former ainsi un nouveau cluster plus petit." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 9** Écrire une fonction `sous_cluster(cl, x_min, x_max)` qui prend en arguments un cluster `cl` et deux flottants `x_min` et `x_max`, et renvoie le sous-cluster des points dont l’abscisse est comprise entre `x_min` et `x_max` (au sens large). Cette fonction doit avoir une complexité linéaire en la taille du cluster." ] }, { "cell_type": "code", "execution_count": 10, "metadata": { "tags": [ "reponse" ] }, "outputs": [], "source": [ "def sous_cluster(cl, xmin, xmax):\n", " n = len(cl[0])\n", " premiere_ligne = []\n", " i = 0\n", " while i < n and coords_x[cl[0][i]] <= xmax:\n", " if xmin <= coords_x[cl[0][i]]:\n", " premiere_ligne.append(cl[0][i])\n", " i += 1\n", " deuxieme_ligne = [j for j in cl[1] if j in premiere_ligne]\n", " return [premiere_ligne, deuxieme_ligne]" ] }, { "cell_type": "code", "execution_count": 11, "metadata": { "tags": [ "reponse" ] }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[22, 26, 25, 6, 31, 21, 8, 13, 30, 23, 17, 27, 0, 20, 1, 15, 14, 3, 10], [3, 15, 6, 25, 8, 21, 1, 30, 17, 26, 23, 20, 10, 22, 27, 31, 13, 0, 14]]\n" ] } ], "source": [ "print(sous_cluster(cluster, 0.25, 0.75))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 10** Écrire une fonction `mediane(cl)` qui prend en entrée un cluster `cl` contenant au moins 2 points et renvoie une abscisse médiane, c’est-à-dire que la moitié (au moins) des points a une abscisse inférieure ou égale à cette valeur, et la moitié (au moins) des points a une abscisse supérieure ou égale à cette valeur. Cette fonction doit avoir une complexité en $O(1)$." ] }, { "cell_type": "code", "execution_count": 12, "metadata": { "tags": [ "reponse" ] }, "outputs": [], "source": [ "def mediane(cl):\n", " n = len(cl[0])\n", " return (coords_x[cl[0][(n - 1) // 2]] + coords_x[cl[0][n // 2]]) / 2" ] }, { "cell_type": "code", "execution_count": 13, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0.4233770483817454" ] }, "execution_count": 13, "metadata": {}, "output_type": "execute_result" } ], "source": [ "mediane(cluster)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Méthode sophistiquée" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Le fonctionnement de l'algorithme utilisant une méthode de type *diviser pour régner* est illustré par la figure 2 :\n", "\n", "1. Si le cluster contient deux ou trois points, on calcule la distance minimale en calculant toutes les distances possibles.\n", "2. Sinon, on sépare le cluster en deux parties $G$ et $D$ qu'on supposera de tailles égales (éventuellement à un point près) suivant la médiane des abscisses, qu’on notera $x_0$.\n", "3. Les deux points les plus proches sont soit tous les deux dans $G$, soit tous les deux dans $D$, soit un dans $G$ et un dans $D$.\n", "4. On calcule récursivement le couple le plus proche dans $G$ et le couple le plus proche dans $D$. On note $d_0$ la plus petite des deux distances obtenues.\n", "5. On cherche s’il existe une paire de points $(M_1, M_2)$ telle que $M_1$ est dans $G$, $M_2$ dans $D$, et $d(M_1, M_2)< d_0$.\n", "6. Si on en trouve une (ou plusieurs), on renvoie la plus petite de ces distances. Sinon, on renvoie $d_0$.\n", "\n", "![Illustration de la méthode diviser pour régner](points_proches_diviser_regner.png)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 11** Écrire une fonction `gauche(cl)` qui prend en argument un cluster `cl` contenant au moins deux points et renvoie le cluster constitué uniquement de la moitié (éventuellement arrondie à l’entier supérieur) des points les plus à gauche du cluster `cl`." ] }, { "cell_type": "code", "execution_count": 14, "metadata": { "tags": [ "reponse" ] }, "outputs": [], "source": [ "def gauche(cl):\n", " x0 = mediane(cl)\n", " return sous_cluster(cl, coords_x[cl[0][0]], x0)" ] }, { "cell_type": "code", "execution_count": 15, "metadata": { "tags": [ "reponse" ] }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[12, 19, 4, 2, 29, 24, 16, 11, 22, 26, 25, 6, 31, 21, 8, 13], [2, 6, 29, 25, 11, 19, 12, 8, 21, 24, 26, 16, 22, 31, 13, 4]]\n" ] } ], "source": [ "print(gauche(cluster))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On suppose qu'on dispose d'une fonction `droite(cl)` qui renvoie le cluster contenant tous les autres points du cluster `cl` n'appartenant pas au cluster renvoyé par la fonction `gauche(cl)`." ] }, { "cell_type": "code", "execution_count": 16, "metadata": { "tags": [ "hors_enonce" ] }, "outputs": [], "source": [ "def droite(cl):\n", " x0 = mediane(cl)\n", " return sous_cluster(cl, x0, coords_x[cl[0][-1]])" ] }, { "cell_type": "code", "execution_count": 17, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[30, 23, 17, 27, 0, 20, 1, 15, 14, 3, 10, 18, 7, 5, 28, 9], [3, 7, 15, 1, 30, 17, 23, 20, 9, 10, 28, 5, 27, 18, 0, 14]]\n" ] } ], "source": [ "print(droite(cluster))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 12** Justifier que l'on peut se contenter de chercher les points $M_1$ et $M_2$ de l'étape 5 de l'algorithme dans l'ensemble des points dont l'abscisse appartient à $I_0= [x_0-d_0, x_0+d_0]$." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Si $d_0$ est la plus petite des deux distances séparant les deux points les plus proches de la partie gauche du cluster d'une part et les deux points les plus proches de la partie droite d'autre part, alors si dans la bande centrale on trouve deux points à distance strictement inférieure à $d_0$, alors l'un, $M_1$, est nécessairement dans la partie gauche, et l'autre, $M_2$, dans la partie droite (sinon cela contredirait la définition de $d_0$).\n", "\n", "Par ailleurs, l'abscisse $x_1$ de $M_1$ ne peut pas être strictement inférieure à $x_0-d_0$ et celle $x_2$ de $M_2$ ne peut pas être strictement supérieure à $x_0+d_0$ car dans le cas contraire on aurait $d(M_1, M_2) > d_0$.\n", "\n", "Cela justifie donc qu'il suffit de rechercher l'éventuelle présence d'un couple de points proches dans la bande des points d'abscisse appartenant à l'intervalle $[x_0-d_0, x_0+d_0]$." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 13** Écrire une fonction `bande_centrale(cl, d0)` qui prend en argument un cluster `cl` et un réel `d0`, et renvoie le cluster des points dont l'abscisse est dans $I_0$. Cette fonction doit avoir une complexité linéaire en la taille du cluster." ] }, { "cell_type": "code", "execution_count": 18, "metadata": { "tags": [ "reponse" ] }, "outputs": [], "source": [ "def bande_centrale(cl, d0):\n", " x0 = mediane(cl)\n", " return sous_cluster(cl, x0-d0, x0+d0)" ] }, { "cell_type": "code", "execution_count": 19, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[22, 26, 25, 6, 31, 21, 8, 13, 30, 23, 17, 27, 0, 20, 1, 15, 14], [15, 6, 25, 8, 21, 1, 30, 17, 26, 23, 20, 22, 27, 31, 13, 0, 14]]\n" ] } ], "source": [ "print(bande_centrale(cluster, 0.2))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 14** Montrer que deux points $M_1$ et $M_2$ (de l’étape 5 de l'algorithme) situés à une distance inférieure à $d_0$ se trouvent, dans la deuxième ligne du cluster (c'est-à-dire la ligne triée par ordonnées croissantes), séparés d'au plus 6 éléments. \n", "\n", "On pourra montrer par l'absurde qu'un rectangle, à préciser, de dimensions $2d_0\\times d_0$ contient au plus 8 points." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Commençons par montrer que dans un carré de côté $c$ il ne peut y avoir qu'au plus quatre points séparés d'une distance au moins égale à $c$.\n", "\n", "Supposons qu'on ait cinq points $M_i$, $i=1,..., 5$, tels que pour tout couple $(i, j)\\in [1, 5]^2$, avec $i\\neq j$ on ait\n", "$$ d(M_i, M_j) \\geq c.$$\n", "\n", "Alors en coupant le carré selon une ligne médiane pour obtenir deux rectangles de dimension $c\\times \\frac{c}{2}$, l'un de ces deux rectangles doit contenir au moins trois des cinq points $M_i$. Et en coupant ce rectangle en deux selon une ligne médiane pour obtenir deux carrés de côtés $\\frac{c}{2}$, l'un des deux carrés doit contenir au moins deux points.\n", "\n", "Or dans un carré de côté $\\frac{c}{2}$ tout couple de points est à distance au moins égale à $\\frac{c\\sqrt{2}}{2} < c$. Ceci contredit que les cinq points sont à distance au moins égale à $c$. Ce qui établit le fait que dans un carré de côté $c$, on ne peut considérer qu'au maximum quatre points à distance au moins égale à $c$. (Ce qui est possible en considérant les quatre sommets du carré).\n", "\n", "Soit $y$ un réel quelconque. Considérons un rectangle $[x_0 - d_0; x_0+d_0]\\times[y; y+d_0]$ situé dans la bande centrée en la médiane $x_0$ du cluster et de largeur $2d_0$, $d_0$ étant la plus petite des deux distances séparant les points les plus proches situés dans le sous-cluster gauche, et les points les plus proches situés dans le sous-cluster droit.\n", "\n", "Les points du cluster situés dans partie gauche de ce rectangle, c'est-à dire dans le carré $[x_0-d_0; x_0]\\times [y; y+d_0]$ de côté $d_0$ sont tous à distance au moins égale à $d_0$ les uns des autres. Ils sont donc en nombre au plus égal à quatre. De même pour les points du cluster situés dans la partie droite. Par conséquent le rectangle ne contient qu'au plus huit points du rectangle. (Cette majoration doit pouvoir certainement être améliorée.)\n", "\n", "S'ils existent les deux points de la bande centrale à distance dtrictement inférieure à $d_0$ sont situés dans un rectangle de la forme $[x_0 - d_0; x_0+d_0]\\times[y; y+d_0]$ qui ne contient qu'au maximum huit points du cluster. Comme la deuxième ligne est triée par ordre croissant des ordonnées, il y a au maximum six points entre ces deux points." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 15** En déduire une fonction `fusion(cl, d0)` qui prend en entrée un cluster de points dont toutes les abscisses sont dans un intervalle $[x_0-d_0, x_0+d_0]$, et renvoie la distance minimale entre deux points du cluster si elle est inférieure à $d_0$, ou $d_0$ sinon. Cette fonction doit avoir une complexité linéaire en la taille du cluster `cl`. Vous justifierez cette complexité." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Compte-tenu du fait établi dans la question précédente, pour rechercher les deux points $M_1$ et $M_2$ les plus proches dans une bande centrale, il suffit de les rechercher par ordonnées croissantes, et pour une ordonnée fixée, calculer les distances avec les sept points qui suivent dans l'ordre des ordonnées." ] }, { "cell_type": "code", "execution_count": 20, "metadata": { "tags": [ "reponse" ] }, "outputs": [], "source": [ "def fusion(cl, d0):\n", " n = len(cl[1])\n", " dmin = d0\n", " for i in range(n - 1):\n", " for j in range(i+1, min(n, i+8)):\n", " dist = distance(cl[1][i], cl[1][j])\n", " if dist < dmin:\n", " dmin = dist\n", " return dmin" ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "La complexité de cette fonction est essentiellement proportionnelle au nombre de fois que les instructions des lignes 6 à 8 sont exécutées, autrement dit au nombre de calculs de distance. Et ce nombre de calculs de distance est égal à\n", "\n", "$$ \\sum_{i=0}^{n-2}\\sum_{j=i+1}^{\\min(n-1,i+7)}1 = (\\sum_{i=0}^{n-8}7) + (6 + 5 + 4 + 3 + 2 + 1) =7(n-7) + 21 = 7n - 28.$$\n", "\n", "Ceci établit que la complexité de la fonction est en $\\Theta(n)$, et donc qu'elle est linéaire." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 16** Écrire une fonction récursive `distance_minimale(cl)` qui prend en argument un cluster et utilise l'algorithme décrit plus haut pour renvoyer la distance minimale entre deux points du cluster." ] }, { "cell_type": "code", "execution_count": 21, "metadata": { "tags": [ "reponse" ] }, "outputs": [], "source": [ "def distance_minimale(cl):\n", " n = len(cl[0])\n", " if n == 2:\n", " return distance(cl[0][0], cl[0][1])\n", " else:\n", " x0 = mediane(cl)\n", " gauche = sous_cluster(cl, coords_x[cl[0][0]], x0)\n", " droite = sous_cluster(cl, x0, coords_x[cl[0][-1]])\n", " d0 = min(distance_minimale(gauche),\n", " distance_minimale(droite))\n", " d1 = fusion(sous_cluster(cl, x0-d0, x0+d0), d0)\n", " return d1" ] }, { "cell_type": "code", "execution_count": 22, "metadata": { "tags": [ "reponse" ] }, "outputs": [ { "data": { "text/plain": [ "0.025248772056030447" ] }, "execution_count": 22, "metadata": {}, "output_type": "execute_result" } ], "source": [ "distance_minimale(cluster)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Remarque :** dans la réalisation de cette fonction, nous n'avons pas utilisé les fonctions déterminant les parties gauche et droite, ainsi que la bande centrale du cluster, car chacune de ces trois fonctions effectue le calcul de la médiane. Notre réalisation n'effectue qu'un seul calcul de médiane." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 17** Si on note $n$ la taille du cluster `cl`, et $C(n)$ le nombre d'opérations élémentaires réalisées par la fonction `distance_minimale(cl)`, justifier que l'on a :\n", "\n", "$$ C(n) = 2C(n/2) +O(n).$$" ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Lorsque $n>2$, le nombre $C(n)$ d'opérations élémentaires est égal au nombre d'opérations élémentaires pour chaque appel récursif, qui s'effectue sur des clusters ayant deux fois moins de points, soit $C(n/2)$ pour chacun d'eux, auxquelx il faut ajouter le nombre d'opérations élémentaires pour le calcul de la médiane, le calcul des sous-clusters gauche et droite et la bande centrale, et le calcul de la fusion, chacune de ces étapes s'effectuant avec une complexité linéaire, donc $\\Theta(n)$ opérations supplémentaires au total.\n", "Ainsi on a pour $n>2$\n", "\n", "$$C(n) = 2C(n/2) + \\Theta(n).$$\n", "\n", "Pour $n=2$, le seul calcul est un calcul de distance, donc en $\\Theta(1)$.\n", "\n", "$$C(2) = \\Theta(1).$$" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 18** En déduire, en la démontrant, la complexité $C(n)$. On pourra se limiter au cas où $n$ est une puissance de 2." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Si on se limite au cas où $n$ est une puissance de deux, alors en posant $n=2^p$ et $c'(p) = C(n)$, les équations précédentes deviennent\n", "\n", "$$ c'(p) = 2c(p-1) + \\Theta(2^p),$$\n", "et\n", "$$ c'(1) = \\Theta(1).$$\n", "\n", "On reconnaît l'équation de récurrence d'une suite récurrente linéaire du 1er ordre, de raison 2 et de second membre $O(2^p)$. Comme ce second membre s'exprime avec une puissance de la raison, la solution de ces équations est donc de la forme\n", "\n", "$$c'(p) = \\Theta(p2^p).$$\n", "\n", "D'où l'on deduit que, lorsque $n$ est une puissance de deux,\n", "\n", "$$C(n) = \\Theta(n\\log(n)).$$\n", "\n", "On admet que cela est vrai aussi pour $n$ quelconque. La complexité est donc d'un ordre de grandeur bien inférieur à celui de l'approche exhaustive." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "hors_enonce" ] }, "source": [ "**Vérification expérimentale des résultats établis**" ] }, { "cell_type": "code", "execution_count": 23, "metadata": { "tags": [ "hors_enonce" ] }, "outputs": [], "source": [ "from ap2_decorators import count\n", "distance = count(distance)" ] }, { "cell_type": "code", "execution_count": 24, "metadata": { "tags": [ "hors_enonce" ] }, "outputs": [], "source": [ "N = 200\n", "meth1 = []\n", "meth2 = []\n", "for n in range(2, N):\n", " coords_x = [random() for _ in range(n)]\n", " coords_y = [random() for _ in range(n)]\n", " distance.counter = 0\n", " _ = plus_proche()\n", " meth1.append(distance.counter)\n", " liste_x = list(range(n))\n", " tri(liste_x, coords_x)\n", " liste_y = list(range(n))\n", " tri(liste_y, coords_y)\n", " cluster = [liste_x, liste_y]\n", " distance.counter = 0\n", " _= distance_minimale(cluster)\n", " meth2.append(distance.counter)" ] }, { "cell_type": "code", "execution_count": 25, "metadata": { "tags": [ "hors_enonce" ] }, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "liste_n = list(range(2, N))\n", "plt.plot(liste_n, meth1, 'r.', label='méthode 1')\n", "plt.plot(liste_n, meth2, 'g.', label='méthode 2')\n", "plt.legend()\n", "plt.show()" ] }, { "cell_type": "code", "execution_count": 26, "metadata": {}, "outputs": [], "source": [ "from math import log" ] }, { "cell_type": "code", "execution_count": 27, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "c = 1.3\n", "plt.plot(liste_n, meth2, 'g.', label='méthode 2')\n", "plt.plot(liste_n, [c*n*log(n) for n in liste_n], label='{:3.2f} nlog(n)'.format(c))\n", "plt.legend()\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Problème 2 : Composantes connexes et biconnexes" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Site Internet et bases de données" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On s'intéresse dans cette partie à un site Internet d'échange de supports de cours entre enseignant·e·s de NSI. Chaque personne désirant proposer ou récupérer du contenu doit commencer par se créer un compte sur ce site et peut ensuite accéder à du contenu ou en proposer." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 19** Expliquer sommairement la différence entre Internet et le web." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Internet est un réseau (de réseaux) d'ordinateurs permettant de mettre en place plusieurs protocoles de communication.\n", "\n", "Le web est un réseau hypertexte qui fonctionne grâce à Internet. Les nœuds de ce réseau sont des pages consultables grâce à un navigateur (comme Firefox, Safari, Opera, ...)." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 20** Expliquer deux conséquences du règlement général sur la protection des données (RGPD) sur le site Internet." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Ce site repose sur une base de données contenant en particulier trois tables.\n", "\n", "- La table `comptes` possède un enregistrement par utilisateur ou utilisatrice, et ses attributs sont :\n", " - `id`, un identifiant numérique, unique pour chaque compte ;\n", " - `nom`, le nom de la personne possédant le compte ;\n", " - et d'autres informations, concernant le mot de passe, l'adresse mail, des préférences sur le site, etc., que nous ne détaillons pas ici.\n", "- La table `ressources` possède un enregistrement par document téléversé sur le site. Ses attributs sont :\n", " - `id`, un identifiant numérique, unique pour chaque ressource ;\n", " - `owner`, l'identifiant de la personne ayant créé la ressource ;\n", " - `titre`, une chaine de caractères décrivant la ressource ;\n", " - `type`, chaine de caractères pouvant être `cours`, `ds`, `tp` ou `td`.\n", "- La table `chargement` mémorise chaque fois qu'un utilisateur télécharge une ressource sur le site. Ses attributs sont :\n", " - `date`, date du téléchargement, par exemple `'2021-02-28'` pour le 28 février 2021 (on peut utiliser des opérations de comparaison classiques avec ce format) ;\n", " - `id_u`, identifiant de l'utilisateur qui télécharge la ressource ;\n", " - `id_r`, identifiant de la ressource téléchargée." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Voici un extrait de chacune de ces tables :\n", "\n", "![extrait des trois tables](extrait_tables.png)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 21** Écrire une requête SQL permettant de connaitre le nombre total de ressources de type `cours` présentes sur le site." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "~~~sql\n", "SELECT COUNT(*) FROM ressources WHERE type = 'cours'\n", "~~~" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 22** Que fait la requête suivante ?\n", "\n", "~~~sql\n", "SELECT ressources.titre, comptes.nom\n", "FROM chargement\n", " JOIN ressources ON ressources.id = chargement.id_r\n", " JOIN comptes ON comptes.id = chargement.id_u\n", "ORDER BY chargement.date DESC\n", "LIMIT 1\n", "~~~" ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "On obtient une table d'un seul enregistrement contenant le titre de la ressource la plus récemment téléchargée, ainsi que le nom de celui qui a effectué ce téléchargement." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 23** Écrire une requête SQL qui permet de déterminer la liste des triplets $(x, y, n)$, signifiant que la personne possédant l'identifiant $x$ a téléchargé $n$ fois des documents téléversés par la personne possédant l'identifiant $y$." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On définit le graphe non-orienté $G(V, E)$ où $V$ est l'ensemble des identifiants de comptes sur le site et $E\\subset V\\times V$ l'ensemble des paires d'identifiants telles que le premier compte a déjà téléchargé des documents téléversés par l'autre et réciproquement. Ainsi, si $(x, y)\\in E$, alors on doit avoir $(y, x)\\in E$." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 24** Écrire une requête SQL qui renvoie la table des couples $(x, y)$ de $E$." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Composantes connexes" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "L'objectif de cette partie est de déterminer les composantes connexes du graphe $G$ défini à la partie précédente. Dans toute la suite, on notera $|X|$ le cardinal d'un ensemble $X$. On supposera que l'ensemble $V$ est constitué de sommets numérotés par des entiers consécutifs commençant à 0, c’est-à-dire que $V=\\{0,1, . . . ,|V|-1\\}$. On dira que deux sommets $x$, $y$ de $V$ sont voisins lorsque $(x, y)\\in E$." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "La requête de la question 24 permet de récupérer le résultat sous forme d'une liste de tuples à deux valeurs. On souhaite avoir plutôt une représentation par listes d'adjacences, à savoir une liste de $|V|$ sous-listes, la $i^e$ sous-liste contenant les voisins du sommet $i$. On illustre ces différentes représentations avec le graphe $G_{ex}$ de la figure 3.\n", "\n", "![un graphe exemple](graphe_Gex.png)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Ce graphe serait obtenu à la question 24 sous la forme :" ] }, { "cell_type": "code", "execution_count": 28, "metadata": {}, "outputs": [], "source": [ "g_ex_a = [\n", " (0, 1), (0, 2), (0, 3), (1, 0), (1, 4), (1, 8),\n", " (2, 0), (2, 3), (3, 0), (3, 2), (3, 6),\n", " (4, 1), (5, 6), (6, 3), (6, 5),\n", " (7, 9), (8, 1), (9, 7)\n", "]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Sa représentation par listes d’adjacences serait :" ] }, { "cell_type": "code", "execution_count": 29, "metadata": {}, "outputs": [], "source": [ "g_ex_b = [[1, 2, 3], [0, 4, 8], [0, 3],\n", " [0, 2, 6], [1], [6], [3, 5], [9], [1], [7]\n", " ]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 25** Écrire une fonction `adjacences(n, li)` qui prend en argument un entier `n` correspondant à $|V|$ et `li`, une liste de couples correspondant à un ensemble $E$ (comme par exemple `g_ex_a`) dans un ordre quelconque, et renvoyant la représentation du graphe $G(V, E)$ sous forme de listes d’adjacences (comme par exemple `g_ex_b`)." ] }, { "cell_type": "code", "execution_count": 30, "metadata": { "tags": [ "reponse" ] }, "outputs": [], "source": [ "def adjacences(n, li):\n", " l_adj = [[] for _ in range(n)]\n", " for (x, y) in li:\n", " l_adj[x].append(y)\n", " return l_adj" ] }, { "cell_type": "code", "execution_count": 31, "metadata": { "tags": [ "reponse" ] }, "outputs": [ { "data": { "text/plain": [ "True" ] }, "execution_count": 31, "metadata": {}, "output_type": "execute_result" } ], "source": [ "adjacences(10, g_ex_a) == g_ex_b" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On se donne le programme suivant" ] }, { "cell_type": "code", "execution_count": 32, "metadata": {}, "outputs": [], "source": [ "class Arbre():\n", " def __init__(self, sommet):\n", " self.sommet = sommet\n", " self.children = []\n", " \n", " def add_child(self, child):\n", " self.children.append(child)\n", " \n", "def parcours(listes_adjacences):\n", " n = len(listes_adjacences)\n", " deja_vu = [False] * n\n", " \n", " def explorer(i):\n", " arbre = Arbre(i)\n", " voisins = listes_adjacences[i]\n", " for s in voisins:\n", " if not deja_vu[s]:\n", " deja_vu[s] = True\n", " arbre.add_child(explorer(s))\n", " return arbre\n", " \n", " res = []\n", " for i in range(n):\n", " if not deja_vu[i]:\n", " deja_vu[i] = True\n", " res.append(explorer(i))\n", " return res " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 26** Quel est le type de la valeur renvoyée par la fonction `parcours` ? Appliquer à la main cette fonction sur la liste d’adjacence `g_ex_b` du graphe $G_{ex}$ de la figure 3, et représenter la valeur de retour de cette fonction. Quel est le nom de ce parcours ?" ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Le type de la valeur renvoyée par la fonction `parcours` est celui de la variable locale `res`. Cette variable est initialisée à une liste vide (ligne 22), et les seules éventuelles modifications se font via la méthode `append` (ligne 26). Le type renvoyé est donc une liste.\n", "\n", "On peut ajouter que la liste renvoyée ne contient que des objets de la classe `Arbre`." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 27** Montrer que la complexité de la fonction `parcours` est en $O(|V|+|E|)$. Dans toute la suite, on dira qu'un algorithme ayant cette complexité est *linéaire*." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 28** Rappeler la définition de la connexité d’un graphe." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Un graphe non orienté est connexe si pour tout couple $(x, y)$ de sommets, il existe un chemin menant de $x$ à $y$.\n", "\n", "En particulier, un graphe est connexe si et seulement si en partant d'un sommet $x$ quelconque, on peut atteindre n'importe quel autre, autrement dit si l'arbre obtenu par la `explorer(x)` contient tous les sommets du graphe." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 29** Écrire une fonction `connexe(listes_adjacences)` qui renvoie `True` si le graphe décrit par les listes d'adjacences `listes_adjacences` est connexe et `False` sinon." ] }, { "cell_type": "code", "execution_count": 33, "metadata": { "tags": [ "reponse" ] }, "outputs": [], "source": [ "def connexe(liste_adjacences):\n", " return len(parcours(liste_adjacences)) == 1" ] }, { "cell_type": "code", "execution_count": 34, "metadata": { "tags": [ "reponse" ] }, "outputs": [ { "data": { "text/plain": [ "False" ] }, "execution_count": 34, "metadata": {}, "output_type": "execute_result" } ], "source": [ "connexe(g_ex_b)" ] }, { "cell_type": "code", "execution_count": 35, "metadata": { "tags": [ "reponse" ] }, "outputs": [ { "data": { "text/plain": [ "True" ] }, "execution_count": 35, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# sous graphe de G_ex et renommage du sommet 8 en 7\n", "autre_graphe = [list(g_ex_b[i]) for i in range(9) if i != 7]\n", "autre_graphe[1][2] = 7\n", "connexe(autre_graphe)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 30** Écrire une fonction `composantes_connexes(p_graphe)` prenant en argument `p_graphe` le graphe obtenu avec la fonction `parcours` et renvoie les composantes connexes sous forme de liste de listes de sommets." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "**Remarque** la description de l'argument de la fonction demandée dans l'énoncé ne correspond pas à la réponse fournie à la question 26. On répond donc à cette question en considérant que l'argument de la fonction est un graphe décrit pas une liste d'adjacences." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "On commence par une fonction qui renvoie la liste des sommets contenu dans un arbre." ] }, { "cell_type": "code", "execution_count": 36, "metadata": { "tags": [ "reponse" ] }, "outputs": [], "source": [ "def liste_noeuds(arbre):\n", " res = [arbre.sommet]\n", " for child in arbre.children:\n", " res.extend(liste_noeuds(child))\n", " return res" ] }, { "cell_type": "code", "execution_count": 37, "metadata": {}, "outputs": [], "source": [ "def composantes_connexes(liste_adjacences):\n", " return list(map(liste_noeuds, parcours(liste_adjacences)))" ] }, { "cell_type": "code", "execution_count": 38, "metadata": { "tags": [ "reponse" ] }, "outputs": [ { "data": { "text/plain": [ "[[0, 1, 4, 8, 2, 3, 6, 5], [7, 9]]" ] }, "execution_count": 38, "metadata": {}, "output_type": "execute_result" } ], "source": [ "composantes_connexes(g_ex_b)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 31** Quelle est la limitation liée au fait que la fonction `explorer`, codée en Python, est récursive ?" ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Par défaut, Python limite à environ 1000 le nombre des appels récursifs à une fonction. Donc si le graphe contient un grand nombre de sommets de sorte qu'on y trouve un chemin contenant plus de 1000 sommets non visités, la fonction `explorer` ne pourra pas accomplir son travail. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Dans toute la suite, lorsqu'une fonction est demandée, on pourra utiliser ou non une fonction récursive, au choix des candidat.e.s." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Graphes biconnexes" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On suppose dans cette partie que $G$ est un graphe connexe. Si $\\forall i\\in [0;k]\\, x_i\\in V$, on appelle *chaine* une suite finie $(x_0, x_1, ... , x_k)$ telle que pour tout $i$, on ait $(x_i, x_{i+1})\\in E$. Cette chaine est un *cycle* lorsque $x_0=x_k$, et c'est de plus un *cycle élémentaire* si tous les sommets $x_0$, ... , $x_{k−1}$ sont distincts deux à deux. On dit que $G(V, E)$ est *biconnexe* lorsque :\n", "\n", "- $|V|= 1$ ;\n", "- $|V|= 2$, $V=\\{a, b\\}$ et $(a, b)\\in E$;\n", "- ou $|V|\\geq 3$ et pour toute paire $(x, y)\\in V^2$, il existe un cycle élémentaire contenant $x$ et $y$." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Question 32** Montrer qu'un graphe biconnexe est également connexe." ] }, { "cell_type": "markdown", "metadata": { "tags": [ "reponse" ] }, "source": [ "Lorsque $|V|=1\\mbox{ ou }2$, il n'y a pas de distinctions entre la connexité et la biconnexité.\n", "\n", "Soit $G=(V, E)$ un graphe à au moins trois sommets, et $x$ et $y$ deux sommets distincts de ce graphe. La biconnexité entraîne l'existence d'un cycle élémentaire $(x_0, x_1, ..., x_k=x_0)$ contenant $x$ et $y$. Il existe deux indices $i$ et $j$ tels que $x_i=x$ et $x_j=y$. On peut toujours supposer que $i